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一 本 写 给 设计 师 的 未 来 指南 


人 工 智 能 正在 向 设计 界 进军 : 
一 键 抠 图 、 自 动 排版 、 合 成 场景 、 自 主 设计 等 


作为 设计 师 ， 如 何 找 准 定位 ， 实 现价 值 ? 
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内 容 简介 


相 比 移动 互联 网 设计 ， 人 工 智能 时 代 的 设计 会 更 有 挑战 性 ， 原 因 在 于 人 工 智能 技 
术 尚 未 成 熟 以 及 语音 识别 、 增 强 现 实 和 虚拟 现实 等 与 人 工 智能 相关 的 新 领域 都 需要 时 
间 来 探索 。 在 未 来 ， 设 计 师 需要 考虑 更 多 的 技术 因素 ， 但 国内 绝 大 部 分 设计 师 缺 乏 技 
术 背 景 。 

为 了 解决 设计 师 的 这 一 刚 需 ， 本 书 会 从 技术 角度 切入 ， 介 绍 当下 人 工 智能 的 相关 知 
识 ， 再 围绕 商业 、 产 品 、 用 户 需 求 等 多 个 角度 阐述 人 工 智 能 与 设计 的 关系 ， 提 出 人 工 智 
能 设计 的 相关 见解 ， 同 时 也 会 结合 作者 自己 的 学 习 和 工作 经 验 ， 对 设计 师 在 AI 时 代 下 的 
发 展 规划 给 出 相关 建议 。 
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在 20 世纪 90 年 代 早 期 ， 国 内 设计 界 开始 广泛 将 计算 机 应 用 
于 设计 工作 中 ， 特 别 在 桌面 排版 领域 ， 为 设计 师 带 来 了 新 型 的 排 
版 和 输出 方式 。 一 方面 , 功能 强大 的 软件 让 设计 师 会 担心 被 取代 
另外 一 方面 ， 随 着 计算 机 艺术 设计 软件 的 广泛 运用 ， 同 质 化 的 作 
品 也 开始 出 现 ， 从 而 引发 设计 师 的 警觉 与 争议 。 当 下 再 回顾 这 段 
历史 ， 虽 然 仍 有 部 分 工作 被 取代 ， 但 是 设计 师 获 取 了 更 加 便利 和 
自由 的 工具 和 助手 ， 以 往 的 担忧 并 没有 成 为 现实 。 

当下 ， 人 工 智 能 快速 发 展 ， 人 们 再 次 担心 职业 被 取代 的 问题 。 
哪怕 是 以 人 为 本 、 带 来 美感 和 灵感 创作 的 设计 领域 都 发 寂 可 危 。 各 
大 企业 纷纷 制定 出 人 工 智 能 先行 的 发 展 策略 ， 主 流 的 人 工 智能 平 
人 台 也 借助 开源 的 模式 打造 生态 圈 ， 同 时 支持 更 多 领域 的 初创 企业 
和 创新 应 用 。 设 计 作 为 科技 、 人 文 与 商业 交叉 领域 的 学 科 ， 正 受 
到 人 工 智能 再 次 兴起 的 影响 。 2017 年 阿里 智能 设计 实验 室 推出 “ 鹿 
班 ” 系 统 ,“ 双 11” 期 间 设 计 出 4 亿 张 Banner， 这 给 设计 师 确实 
带 来 不 小 的 冲击 。 在 这 样 的 环境 下 , 我 们 该 如 何 提升 自己 的 能 力 ? 
人 工 智 能 会 取代 设计 师 还 是 成 为 更 强大 的 设计 辅助 工具 ? 

人 工 智 能 已 逐步 演变 成 创新 的 基础 设施 ， 也 将 成 为 设计 师 的 
助理 和 伙伴 ， 一 部 分 重复 性 的 劳动 以 及 海量 的 数据 分 析 工 作 都 可 
以 由 人 工 智 能 协助 ， 设 计 师 可 以 有 更 多 的 精力 侧重 于 评价 、 判 断 
和 选择 ， 由 此 使 自己 更 具 个 性 化 的 创造 力 、 应 对 复杂 问题 识别 机 
会 的 能 力 、 批 判 性 思维 能 力 , 以 上 将 成 为 设计 师 着 力 发 展 的 核心 。 
Dell 公司 EMC 服务 的 首席 技术 官 比尔 。 施 马 佐 (Bill Schmarzo) 
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结合 机 器 学 习 ， 提 出 了 分 析 (Analyze) 、 合 成 〈Synthesize) 、 设 
想 (Ideate)、 调 优 (Tuning )、 验 证 (Validate) 的 设计 步骤 ， 这 与 
IDEO 提出 的 设计 思维 有 很 大 的 契合 点 。 以 上 过 程 中 都 需要 对 利益 
相关 者 、 学 习 的 事物 进行 分 析 ， 了 解 用 户 的 需求 ， 对 目标 进行 定义 
和 计划 ， 为 创建 的 问题 提出 一 定数 量 的 愿景 方案 ， 再 根据 设想 设计 
原型 或 调整 模型 ， 最 后 对 产品 进行 评测 和 验证 。 这 也 为 人 工 智能 时 
代 的 设计 发 展 提 供 了 程序 与 方法 上 的 支持 。 

对 设计 而 言 ， 人 工 智能 将 是 一 种 新 的 思考 方式 ， 也 是 一 种 新 
的 实现 手段 。 在 产品 战略 方面 ， 需 要 探索 适合 的 应 用 场景 ， 以 需 
求 为 导向 ， 在 产品 实现 方面 ， 要 有 技术 实现 能 力 ， 也 需要 获取 高 
质量 的 数据 。 这 些 都 要 求 设 计 师 具有 对 趋势 的 把 握 能 力 、 对 用 户 
体验 的 塑造 能 力 ， 以 及 跨 学 科 的 综合 实现 能 力 。 未 来 ， 对 设计 和 
设计 师 自身 的 研究 ， 将 成 为 设计 与 人 工 智能 结合 的 基础 ， 有 多 人 少 
对 设计 的 深刻 理解 ， 也 就 有 多 少 设 计 的 智能 。 

薛 志 荣 先生 的 《AI 改变 设计 一 一 人 工 智能 时 代 的 设计 师 生 
存 手册 》， 以 设计 师 的 语言 ， 探 索 了 人 工 智能 发 展 的 历史 ， 并 对 
人 工 智 能 时 代 设 计 对 象 、 设 计 流 程 、 设 计 应 用 及 设计 师 的 能 力 塑 
造 ， 提 供 了 全 方位 的 解析 和 描述 。 对 于 设计 师 来 说 ， 这 是 一 个 非 
常 好 的 学 习 和 理解 人 工 智 能 与 相关 设计 知识 旅程 的 起 点 。 人 工 智 
能 作为 设计 工具 和 伙伴 ， 能 为 设计 师 带 来 更 多 的 设计 发 挥 空间 和 
创新 思想 。 也 期 待 本 书 能 够 引领 更 多 设计 师 参 与 提升 人 工 智 能 的 
水 平 ， 为 设计 未 来 的 发 展 提供 更 有 创建 性 的 解决 方案 。 





付 志 勇 
清华 大 学 美术 学 院 副 教授 


“AI 时 代 的 设计 师 生 存 手册 ”? 

这 话 其 实说 得 不 完全 对 ， 因 为 在 AI 时 代 中 要 考虑 生存 问题 
的 ， 不 只 是 设计 师 ， 而 是 各 行 各 业 的 每 个 人 ! 这 是 每 个 人 都 不 
得 不 面 对 的 危险 与 机 会 。 世 界 各 地 都 有 研究 者 对 于 人 工 智 能 取代 
人 类 工作 做 出 了 预测 ， 即 便 是 最 乐观 的 结果 ， 也 是 在 接 下 来 几 
十 年 内 会 有 一 半 以 上 的 人 类 工作 被 人 工 智 能 取代 。 最 容易 被 取 
代 的 ， 是 那些 规则 性 强 、 易 于 做 判断 的 工作 。 例 如 ， 美 国 在 互联 
网 和 人 工 智能 的 连续 冲击 下 ， 股 票 交易 员 事实 上 已 经 成 为 消失 的 
职业 。 而 最 难 被 取代 的 三 类 职业 ， 则 是 跨 领 域 综合 决策 类 (例如 
CEO)、 创 造 力 类 (例如 设计 师 ， 但 是 各 行 各 业 都 可 以 做 到 以 创 
造 力 去 解决 问题 ) 、 情 感 与 服务 类 《〈 例 如 保姆 ) 。 

设计 师 位 列 最 难 被 取代 的 三 类 职业 之 一 ， 但 干 万 别 觉得 可 以 
高 枕 无 忧 。 

一 方面 ， 今 天 市 场 上 存在 大 量 的 设计 师 ， 因 为 种 种 原因 ， 事 
实 上 在 做 着 规则 性 非常 强 、 创 造 力 水 平 非常 低 的 工作 ， 所 以 “ 鹿 
班 ”不 仅 在 设计 数量 上 ， 哪 怕 在 设计 质量 上 都 能 胜 过 很 多 “设计 
师 ”。 这 样 的 “设计 师 ” 显 然 是 会 被 取代 的 。 

另 一 方面 ， 人 工 智能 应 用 将 会 带 来 设计 基础 、 设 计 对 象 、 设 
计 方 法 上 的 全 面 冲击 ， 例 如 产品 不 一 定 有 可 视 化 的 界面 ， 可 能 会 
让 视觉 设计 师 感 到 无 所 适 从 ; 人 工 智能 产品 对 于 软 硬 件 的 共同 依 
赖 ， 可 能 会 让 习惯 了 做 软件 设计 或 硬件 设计 的 设计 师 面 临 巨大 挑 


| Al 改变 设计 | 人 工 智 能 时 代 的 设计 师 生存 手册 





战 ; 人 工 智 能 通过 充分 使 用 数据 而 使 产品 真正 意义 上 做 到 干 人 干 
面 ， 对 于 设计 方法 和 流程 更 是 提出 了 革新 的 要 求 …… 

设计 面临 重大 挑战 ， 设 计 师 面临 重大 挑战 ， 即 便 你 不 是 设计 
师 ， 也 将 在 创造 力 上 面临 重大 挑战 。 所 幸 ， 每 一 波 技术 进步 ， 都 





会 向 产品 设计 转移 ， 设 计 才 会 真正 站 到 这 一 波 技术 的 浪潮 之 车 。 
互联 网 从 技术 开始 广泛 应 用 ， 到 产品 设计 成 为 竞争 的 焦点 ， 经 历 
了 差不多 十 年 的 时 间 (大 约 是 1995 一 2005 年 ) ; 这 一 波 人 工 智 
能 技术 的 发 展 很 可 能 比 互联 网 当年 更 快 。 这 也 意味 着 ， 还 有 留 给 
设计 师 准 备 的 时 间 ， 但 也 不 多 了 。 

最 后 ， 我 们 现在 说 的 可 能 都 是 错 的 一 一 在 高 速 发 展 的 技术 面 
前 ， 没 有 人 能 用 过 去 的 经 验 准 确 预知 一 切 。 所 以 每 个 人 都 需要 更 
认真 地 发 现 自己 内 心 的 追求 ， 更 努力 地 为 将 来 做 准备 ， 更 坦然 地 
面 对 可 能 发 生 的 变化 。 


吴 卓 洗 

创新 工场 人 工 智 能 工程 院 副 总 裁 
前 谷歌 中 国 用 户 体验 团队 负责 人 
2018 年 11 月 16 日 于 高 铁 上 
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小 时 候 最 喜欢 做 的 事情 就 是 每 周末 晚上 9 点 半 搬 个 小 使 子 坐 
在 电视 前 看 香港 明珠 台 的 电影 节目 , 《少数 派 报 告 》《 黑 客 帝 国 》 
《钢铁 侠 》《 第 九 区 》《 机 械 公敌 》《 创 战 纪 》 等 科幻 片 一 直 是 
我 最 喜欢 看 的 电影 。 我 坚信 终 有 一 天 我 们 的 生活 会 变 成 像 科幻 片 
里 的 一 样 : 随时 随地 随手 在 空气 中 唤醒 一 个 计算 机 界面 ， 然 后 想 
干 嘛 就 干 嘛 。 有 人 说 过 ， 每 一 个 科幻 小 说 作家 都 是 一 位 预言 家 ， 
只 是 大 家 不 知道 他 的 愿景 几时 会 发 生 。 既 然 已 经 有 了 预言 ， 那 何 
不 自己 党 试 去 实现 它 呢 ? 科幻 片 里 各 种 酷 炫 的 特效 ， 在 我 幼小 的 
心灵 里 种 下 一 粒 做 设计 师 的 种 子 。 

如 果 问 未 来 5 年 的 设计 是 什么 样 的 ， 我 们 可 以 先 了 解 一 下 前 
10 年 互联 网 的 发 展 史 。 先 回顾 2008 年 : 中 国 网 民 规 模 达 到 2.9 亿 人 ， 
普及 率 达 到 21%。 当 时 Intel 发 布 了 Core i7 处 理 器 第 一 代 架 构 
Nehalem、 英 伟 达 发 布 了 GTX 200 系列 显卡 。 计 算 机 的 主要 用 途 
是 打 游戏 、 执 行 各 种 工作 软件 和 上 网 。 当 时 的 互联 网 已 经 进入 Web 
2.0 时 代 ， 主 要 领域 有 社交 (QQ、Facebook、 博 客 、 论 坛 、 贴 吧 ) 、 
视频 (Youtube、 土 豆 、 优 酷 ) 、 音 乐 〈 酷 狗 ) 、 门 户 网 站 〈 新 浪 、 
搜狐 ) 和 OTA (携程 、 去 哪儿 ) 。 用 户 的 移动 设备 以 功能 机 为 主 ， 
当时 的 2G 网 络 网 速 平均 为 13KB/s。 苹 果 发 布 了 iPhone 3G 和 移 
动 应 用 商店 App Store; Google 发 布 了 Android 1.0， 智 能 手机 设 
备 处 于 起 步 阶段 ， 主 要 功能 和 功能 机 没有 太 大 差异 ， 都 是 低 像素 


a 
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拍照 、QQ 聊天 和 用 浏览 器 上 Wap 。 

再 看 看 2013 年 : 中 国 网 民 规 模 达 到 5.91 亿 人 ， 普 及 率 为 
44.1%; 手机 网 民 规 模 达到 4.64 亿 人 ， 使 用 手机 上 网 的 人 群 占 总 
网 民 人 和 群 比例 的 78.35%， 人 台式 机 上 网 的 网 民 比 例 为 69.5%， 比 例 
持续 下 降 。Intel 发 布 了 Core i7 处 理 器 第 四 代 架 构 Haswell， 性 能 
比 第 一 代 提 升 27%; 英 伟 达 发 布 的 显卡 GTX 700 系列 性 能 比 5 年 
前 的 GTX 200 系列 提升 5 倍 以 上 。 计算机 的 主要 用 途 还 是 打 游 戏 、 
执行 各 种 工作 软件 和 上 网 。 互 联网 新 增 了 团购 、 网 盘 、 云 计算 
等 行业 。 在 移动 互联 网 方面 ， 网 络 升级 为 3G 网 络 ， 平 均 网 速 为 
120KB/s。 苹 果 发 布 了 带 有 指纹 识别 的 iPhone 5s， 性 能 比 iPhone 
3G 提升 50 信 ， 同年 Google 发 布 了 Android 最 重要 的 版 本 4.4， 
此 时 Android 已 经 有 9 亿 部 装置 激活 、480 亿 个 App 安装 。 整 个 
世界 的 移动 互联 网 以 井喷 式 的 速度 发 展 ， 每 家 大 公司 除了 把 PC 
主 营 业务 迁移 至 移动 端 ， 还 新 增 了 团购 、020、 陌 生 人 社交 等 新 

念 ， 各 种 工具 型 App 和 以 LBS (Location Based Service， 基 于 
位 置 的 服务 ) 为 核心 的 衣食 住 行业 务 在 不 断 快 速 发 展 。 

2008 一 2013 年 互联 网 发 生 质变 的 主要 原因 有 以 下 几 点 ; 

(1) 基础 设备 的 性 能 提升 ， 包 括 网 络 速度 、 移 动 设 备 性 能 的 
大 幅度 提升 ， 服 务 器 通过 云 计算 的 方式 大 幅度 增强 运算 力 。 

(2) 移动 设备 比 PC 设备 更 便宜 以 及 方便 携带 。 

(3) 人 机 交互 更 为 简单 ， 从 操控 鼠标 变 成 直接 触 屏 操 控 目标 。 

(4) 以 用 户 为 中 心 的 LBS 概念 得 到 广泛 应 用 。 
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而 到 2018 年 ， 中 国 网 民 规 模 达 到 8.02 亿 人 ， 普 及 率 为 
55.7%; 手机 网 民 规模 达到 7.88 亿 ， 使 用 手机 上 网 的 人 群 占 总 
网 民 人 群 比例 的 98.3%， 人 台式 机 上 网 的 网 民 比 例 依然 持续 下 降 。 
Intel 发 布 了 Core i7 处 理 器 第 八代 架构 Coffee Lake， 性 能 比 第 四 代 
提高 30% 左右 ， 英 伟 达 显卡 RTX 2000 系列 的 性 能 将 比 GTX 700 
系列 提升 10 倍 以 上 ， 计 算 机 的 主要 用 途 除 了 打 游 戏 、 执 行 各 种 工 
作 软 件 和 上 网 ， 还 新 增 了 VR 游戏 。 在 移动 互联 网 方面 ， 网 络 升 
级 为 4G 网 络 ， 平 均 网 速 为 1MB/s。 苹 果 发 布 的 iPhone XS 性 能 是 
iPhone 5s 的 12 倍 。 相 比 2013 年 ， 移 动 互 联网 新 增 了 移动 支付 、 
共享 经 济 等 概念 ， 手 机 拍摄 时 自动 美 颜 成 为 主流 ， 视 频 成 为 最 火 
的 传播 媒介 ; 各 种 人 工 智 能 助手 被 不 断 地 提出 ; 各 种 移动 AR 和 
VR 产品 也 在 逐渐 落地 ; 越 来 越 多 的 IoT 设备 例如 智能 音箱 涌 入 市 
场 ; 无 人 驾驶 技术 正在 测试 阶段 ; 各 种 公共 服务 开始 互联 网 化 …… 

2013 一 2018 年 互联 网 发 生 质变 的 主要 原因 有 以 下 几 点 : 

(1) 基础 设备 的 性 能 再 次 提升 ， 包 括 网 络 速度 、 移 动 设备 性 
能 的 大 幅度 提升 。 

(2) 各 种 机 器 学 习 算 法 的 提出 以 及 显卡 GPU 性 能 的 大 幅度 提 
升 促使 并 行 计算 的 运算 力 和 效率 大 大 提高 ， 云 计算 、 无 人 驾驶 、 
计算 机 视觉 、 自 然 语言 处 理 、 知 识 图 谱 等 技术 得 以 快速 发 展 。 

(3) 在 深度 学 习 的 帮助 下 ， 大 数据 终于 有 用 武之 处 。 

(4) 百家争鸣 的 情况 下 企业 很 难 找到 商业 模式 的 突破 点 ， 移 
动 互联 网 已 经 成 为 红海 ， 促 使 资金 流向 oT、 无 人 车 等 领域 。 
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(5) 大 幅度 的 性 能 提升 促使 手机 成 为 最 好 的 边缘 计算 设备 。 
爱 美 之 心 人 皆 有 之 ， 这 也 促使 了 人 工 智 能 技术 与 拍照 、 视 频 领域 
结合 ， 计 算 机 视觉 技术 得 以 广泛 应 用 ; 语言 是 最 自然 的 交互 手段 
之 一 ， 摄 像 头 和 麦克 风 成 为 AI 的 最 重要 入 口 。 

(6) 软 硬 件 技术 的 提升 以 及 成 本 的 降低 促使 IoT 重新 回 到 资 
本 家 的 视野 ， 更 多 的 电子 设备 逐渐 融入 人 类 的 生活 。 

(7) VR、AR 终于 突破 计算 机 视觉 和 计算 机 图 形 学 的 瓶颈 。 

2008 一 2018 年 这 10 年 ， 我 们 使 用 的 计算 机 设备 逐渐 从 台式 
机 缩小 至 手提 笔记 本 ， 再 缩小 至 可 方便 携带 的 移动 设备 ， 我 们 的 
生活 也 因此 发 生 巨 大 的 改变 : 多 名 用 户 使 用 一 全 计算 机 设备 ， 逐 
渐 发 展 为 一 名 用 户 拥有 多 人 台 计 算 机 设备 ， 每 一 全 手机 基本 默认 为 
一 个 已 确认 身份 的 用 户 服 务 ， 全 部 的 产品 功能 都 可 以 围绕 一 个 人 
而 发 生变 化 。 因 此 ， 能 否 满足 用 户 需 求 成 为 设计 的 关键 。 而 商业 
发 展 的 背后 ， 更 多 是 技术 的 发 展 和 成 熟 ， 主 要 包括 网 络 速度 、 算 
法 、 运 算 力 和 数据 四 个 方面 。 未 来 5 年 内 ， 中 国 的 通信 和 网 络 将 升 
级 为 SG 网 络 ， 它 比 4G 网 络 的 速度 快 10 倍 ; 各 种 神经 网 络 算法 
使 得 计算 机 从 “看 清 ”“ 昕 清 ” 逐 渐 发 展 至 “看 懂 ” 和 “上 听 懂 ”; 
至 于 运算 力 方面 ，AI 芯片 和 量子 计算 成 为 每 家 公司 甚至 是 每 个 大 
国 的 主要 竞争 领域 ， 未 来 每 台 设备 都 很 有 可 能 拥有 AI 运算 能 力 。 
用 户 的 数据 分 析 得 益 于 以 上 三 点 ， 将 变 得 更 精准 和 更 高 效 。 

商业 和 用 户 需求 往往 因为 技术 的 变革 会 有 新 的 变化 : 商业 从 
围绕 用 户 群 体制 定 推荐 策略 ， 改 为 围绕 每 一 名 用 户 的 生活 和 经 历 
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制定 不 一 样 的 精准 推荐 ; 每 一 位 用 户 都 希望 自己 的 生活 变 得 更 加 
便利 和 有 趣 。 设 计 是 用 户 、 商 业 和 技术 闭环 中 连接 用 户 与 商业 的 
桥梁 ， 未 来 5 年 设计 是 什么 样 的 ? 这 将 是 我 们 设计 师 需 要 一 起 探 
索 的 话题 。 

当今 时 代 发 展 迅 速 ， 尤 其 是 2015 年 之 后 ， 感 觉 每 一 年 都 是 一 
个 新 领域 的 元 年 ， 每 一 个 新 领域 的 崛起 意味 着 又 有 新 的 设计 技能 
需要 学 习 ， 而 自己 一 不 留神 就 可 能 被 新 的 技术 和 新 的 设计 淘汰 ， 
我 相信 很 多 设计 师 都 有 这 样 的 看 法 。 我 们 如 何 去 应 对 这 个 日 新 月 
异 的 时 代 ? 我 们 是 否 会 被 人 工 智能 取代 ? 我 们 要 如 何在 人 工 智 能 
时 代 下 成 为 更 好 的 设计 师 ? 这 正 是 我 写 这 本 书 的 目的 。 希 望 通过 
这 本 书 ， 能 为 大 家 深入 浅 出 地 讲解 现在 的 人 工 智 能 是 什么 ， 尤 其 
是 为 没有 开发 经 验 的 设计 师 讲解 清楚 人 工 智能 的 历史 背景 和 现 有 
技术 ， 再 结合 一 些 人 工 智能 和 设计 的 案例 ， 让 大 家 清楚 现在 和 未 
来 我 们 能 做 什么 、 怎 么 做 ; 最 后 通过 对 一 些 跨 界 设计 师 的 采访 ， 
希望 能 给 大 家 带 来 一 些 启发 。 

人 工 智 能 时 代 已 经 来 临 ， 你 还 在 等 什么 ? 





作者 ” 葬 志 荣 
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1.1 人 工 智 能 的 发 展 历 程 


说 起 人 工 智 能 (Artificial Intelligence，AI) ， 不 得 不 提 及 
人 工 智能 的 历史 。 人 工 智能 的 概念 主要 由 艾 伦 ， 图 灵 (Alan 
Turing) 9 提出 : 机 器 会 思考 吗 ? 如 果 一 台 机 器 能 够 与 人 类 对 话 而 
不 被 辨别 出 其 机 器 的 身份 , 那么 这 合 机 器 具有 智能 的 特征 。 同 年 ， 
艾 伦 . 图 灵 还 预言 存在 一 定 的 可 能 性 可 以 创造 出 具有 真正 智能 的 
机 器 。 


1.1.1 AI 诞生 


1956 年 8 月 ， 在 达 特 茅 斯 学 院 举行 的 一 次 会 议 上 ， 来 自 不 
同 领域 〈 数 学 、 心 理学 、 工 程 学 、 经 济 学 和 政治 学 ) 的 科学 家 
一 起 讨论 如 何 利 用 机 器 来 模仿 人 类 学 习 以 及 其 他 方面 的 智能 。 
会 议 足 足 开 了 两 个 月 的 时 间 ， 虽 然 大 家 没有 达成 普遍 的 共识 ， 





@ 艾 伦 ,图 灵 (1912.6.23 一 1954.6.7) ， 曾 协助 英国 军队 破解 了 德国 的 著名 密码 系统 
Enigma， 帮 助 盟 军 取得 了 第 二 次 世界 大 战 的 胜利 。 因 提出 一 种 用 于 判定 机 器 是 否 具 
有 智能 的 试验 方法 ， 即 图 灵 试验 ， 被 后 人 称 为 计算 机 之 父 和 人 工 智能 之 父 。 
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但 是 却 为 会 议 讨 论 的 内 容 起 了 一 个 名 字 : “人 工 智能 ”， 并 正 
式 把 人 工 智 能 确立 为 研究 学 科 。 因 此 ，1956 年 成 了 人 工 智能 的 

















2006 年 达 特 茅 斯 会 议 当事人 重 聚 , 左 起 : 特 伦 查 德 摩尔 (Trenchard 
More) 、 约 翰 ， 麦卡锡 (John McCarthy) ?、 马 文 * 明 斯 基 (Marvin 
Minsky) 2、 奥利弗， 赛 尔 弗 里 纪 (Oliver Selfridge) 、 雷 。 索 洛 莫 
洛 夫 (Ray Solomonoff) 





个 约翰。 麦卡锡 (1927.9.4 一 2011.10.24) ， 达 特 茅 斯 会 议 主要 发 起 人 。1956 年 ， 麦 

卡 锡 发 明了 LISP 编程 语言 ， 该 语言 至 今 仍 在 人 工 智 能 领域 广泛 使 用 ，1958 年 ， 麦 

卡 锡 与 明 斯 基 一 起 组 建 了 世界 上 第 一 个 人 工 智 能 实验 室 ， 由 于 在 人 工 智 能 领域 的 杰 
出 贡献 ， 麦 卡 锡 在 1971 年 获得 “计算 机 界 的 诺 贝尔 奖 ” 一 一 图 灵 奖 。 

@ 马 文明 斯 基 (1927.8.9 一 2016.1.24) ， 达 特 茅 斯 会 议 主要 发 起 人 。 由 于 他 的 研究 
引领 了 人 工 智能 、 认 知心 理学 、 神 经 网 络 等 领域 的 发 展 潮流 ， 并 在 图 像 处 理 领域 、 
符号 计算 、 知 识 表 示 、 计 算 语义 学 、 机 器 感知 和 符号 连接 学 习 领 域 做 出 了 许多 贡献 ， 
1969 年 ， 明 斯 基 被 授予 图 灵 奖 ， 这 是 第 一 位 获 此 殊荣 的 人 工 智能 学 者 。 
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1.1.2 ”第 一 次 发 展 高 潮 (1955 一 1974 年 ) 


达 特 茅 斯 会 议 之 后 是 大 发 现 的 时 代 。 对 很 多 人 来 讲 ， 这 一 阶 
段 开 发 出 来 的 程序 堪 称 神奇 计算 机 可 以 解决 代数 应 用 题 、 证 明 
几何 定理 、 学 习 和 使 用 英语 。 在 众多 研究 当中 ， 搜 索 式 推理 、 自 
然 语言 、 微 世界 ”在 当时 最 具 影 响 力 。 

大 量 成 功 的 AI 程序 和 新 的 研究 方向 不 断 涌现 ， 研 究 学 者 认为 
具有 完全 智能 的 机 器 将 在 二 十 年 内 出 现 并 给 出 了 如 下 预言 : 

1958 年 ， 赫 伯 特 "西蒙 (H.A Simon) 和 艾 伦 ， 纽 厄 尔 (Allen 
Newell) 认为 : “十 年 之 内 ， 数 字 计 算 机 将 成 为 国际 象棋 世界 冠 
军 ; 数字 计算 机 将 发 现 并 证 明 一 个 重要 的 数学 定理 。” 

1965 年 ， 赫 伯 特 。 西蒙 认为 :“ 二 十 年 内 ， 机 器 将 能 完成 人 
能 做 到 的 一 切 工作 。” 

1967 年 ， 马 文 。 明 斯 基 认 为 :“ 在 一 代 人 的 时 间 里 ， 各 种 创 
造 “ 人 工 智能 ”的 问题 将 获得 实质 上 的 解决 。” 

1970 年 ， 马 文明 斯 基 认 为 :“ 在 3 一 8 年 的 时 间 里 我 们 将 
得 到 一 台 具 有 人 类 平均 智能 的 机 器 。” 

美国 政府 向 这 一 新 兴 领 域 投入 了 大 笔 资 金 ， 每 年 将 数 百 万 美 
元 投入 到 麻 省 理工 学 院 、 卡 耐 基 梅 隆 大 学 、 爱 丁 堡 大 学 和 斯 坦 福 
大 学 四 个 研究 机 构 ， 并 人 允许 研究 学 者 去 研究 任何 感 兴趣 的 方向 。 











@ ”20 世纪 60 年 代 后 期 ， 马 文明 斯 基 和 西 摩尔 。 派 普 特 (Seymour Papert) 建议 AI 
研究 者 们 专注 于 被 称 为 “ 微 世 界 ” 的 简单 场景 。 他 们 指出 在 成 熟 的 学 科 中 ， 往 往 使 
用 简化 模型 更 能 帮助 理解 基本 原则 ， 例 如 物理 学 中 的 光滑 平面 和 完美 刚体 。 














004 一 一 


| 第 1 章 ， 人 工 智 能 的 定义 与 人 机 交互 的 发 展 | 





当时 主要 成 就 如 下 : 

(1) 人 工 神经 网 络 在 20 世纪 30 一 50 年 代 被 提出 ，1951 年 马 
文 。 明 斯 基 制 造 出 第 一 合 神经 网 络 机 。 

(2) 理 查 。 贝尔 曼 (Richard Bellman) 提出 了 贝尔 曼 方 程 (也 
被 称 为 动态 规划 方程 ， 被 认为 是 强化 学 习 的 雏形 ) 。 

(3) 弗兰克 。 罗 森 布 拉 特 (Frank Rosenblatt) 提出 了 感知 器 
模型 〈 深 度 学 习 的 纵 形 ) 。 

(4) 人 工 智能 研究 人 员 先 后 提出 了 搜索 式 推理 、 自 然 语 言 处 
理 、 微 世界 等 人 工 智能 概念 。 

(5) 人 工 智能 研究 人 员 首 次 提出 : 人 工 智能 拥有 模仿 智能 的 
特征 ， 懂 得 使 用 语言 ， 懂 得 形成 抽象 概念 并 解决 人 类 现存 问题 。 

(6) 亚 瑟 。 塞 缪 尔 (Arthur Samuel) 在 20 世纪 50 年 代 中 期 
和 60 年 代 初 期 开发 了 国际 象棋 程序 ， 程 序 的 棋 力 已 经 可 以 挑战 具 
有 相当 水 平 的 业余 爱好 者 。 

(7) 查理 。 罗 森 (Charlie Rosen) 打造 了 全 球 首 款 具备 移动 
能 力 的 智能 机 器 人 Shakey, 它 可 以 感知 周围 环境 并 创建 路 线 规划 ; 
可 以 根据 明晰 的 事实 来 推断 隐藏 的 含义 ， 能 够 通过 普通 英语 进行 
沟通 。 该 机 器 人 项 目 受到 政府 和 研究 人 员 的 大 力 宣传 ， 人 们 将 其 
视 作 世界 上 第 一 合 通用 机 器 人 。 





1.1.3 ”第 一 次 寒冬 (1974 一 1980 年 ) 


20 世纪 70 年 代 初 ， 人 工 智 能 的 研究 首次 遭遇 到 瓶颈 。 研 究 
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学 者 逐渐 发 现 ， 虽 然 机 器 拥有 了 简单 的 逻辑 推理 能 力 ， 但 遭遇 到 
当时 无 法 克服 的 基础 性 障碍 ， 人 工 智 能 停留 在 “玩具 ”阶段 止步 
不 前 ， 远 远 达 不 到 曾经 预言 的 完全 智能 。 和 詹姆斯 。 莱特 希 尔 (James 
Lighthill) 在 1973 年 发 出 的 报告 中 对 目前 人 工 智能 基础 研究 进 
行 了 评判 ， 认 为 当前 的 自动 机 和 中 央 神 经 系统 研究 虽然 有 价值 但 
进展 令 人 失望 ， 并 认为 机 器 人 研究 没有 太 大 价值 ， 建 议 取消 对 机 
器 人 的 研究 。 由 于 此 前 的 过 于 乐观 使 得 人 们 期 待 过 高 ， 当 人 工 智 
能 研究 人 员 的 承诺 无 法 兑现 时 ， 公 众 开 始 激烈 批评 相关 研究 人 员 ， 
许多 机 构 不 断 减少 对 人 工 智能 研究 的 资助 ， 直 至 停止 拨款 。 

当时 主要 问题 如 下 : 

(1) 计算 机 运算 能 力 遭 遇 瓶 诺 ， 无 法 解决 指数 型 爆炸 的 复杂 
计算 问题 。 

(2) 常识 和 推理 需要 大 量 对 世界 的 认识 信息 ， 计 算 机 达 不 到 
“看 懂 ” 和 “ 听 懂 ”的 地 步 。 

(3) 计算 机 无 法 解决 莫 拉 维 克 悖 论 ? 

(4) 计算 机 无 法 解决 部 分 涉及 自动 规划 的 逻辑 问题 。 

(5) 神经 网 络 研究 学 者 遭遇 冷落 。 








Q@ ” 莫 拉 维 克 悖 论 ， 如 果 机 器 能 像 数 学 天 才 一 样 下 象棋 ， 那 么 它 能 模仿 婴儿 学 习 又 有 多 
难 呢 ? 事实 证 明 这 是 相当 难 的 。 
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1.1.4 第 二 次 发 展 高 潮 (1980 一 1987 年 ) 


20 世纪 80 年 代 初 ， 一 类 名 为 “专家 系统 ”中 的 AI 程序 开始 
被 全 世界 的 公司 所 采纳 ， 人 工 智能 研究 迎 来 了 新 一 轮 高 潮 。 在 这 
期 间 ， 卡 耐 基 梅 隆 大 学 为 DEC 公司 设计 的 XCON 专家 系统 能 够 
每 年 为 DEC 公司 节省 数 干 万 美金 。 日 本 经 济 产 业 省 拨款 8 亿 5 
千 万 美元 支持 第 五 代 计算 机 项 目 ， 其 目标 是 造 出 能 够 与 人 对 话 、 
翻译 语言 、 解 释 图 像 、 能 够 像 人 一 样 推理 的 机 器 。 其 他 国家 也 
纷纷 做 出 了 响应 ， 并 对 AI 和 信息 技术 的 大 规模 项 目 提供 了 巨额 
资助 。 

当时 主要 成 就 如 下 : 

(1) 专家 系统 的 诞生 。 

(2) 人 工 智能 研究 人 员 发 现 智能 可 能 需要 建立 在 对 分 门 别 类 
的 大 量 知识 的 多 种 处 理 方法 之 上 。 

(3) 由 杰 弗 里 。 辛 顿 (Geoffrey Hinton) ® 等 研究 人 员 提 出 的 
反 向 传播 算法 实现 了 神经 网 络 训练 的 突破 ， 神 经 网 络 研究 学 者 重 
新 受到 关注 。 

(4) 人 工 智能 研究 人 员 首次 提出 : 机 器 为 了 获得 真正 的 智能 ， 





@ 专家 系统 : 一 种 程序 ， 能 够 依据 一 组 从 专门 知识 中 推演 出 的 逻辑 规则 在 某 一 特定 领 
域 回 答 或 解决 问题 。 由 于 专家 系统 仅 限 于 一 个 很 小 的 领域 ， 从 而 避免 了 常识 问题 。 
“知识 处 理 ” 随 之 也 成 了 主流 AI 研究 的 焦点 。 

@ ” 杰 弗 里 辛 顿 是 反 向 传播 算法 和 对 比 散 度 算法 的 发 明 人 之 一 ， 也 是 深度 学 习 的 积极 
推动 者 , 被 业界 称 为 “深度 学 习 ” 之 父 和 AI 教 父 , 2013 年 加 入 Google 从 事 AI 研 究 。 














=—007 


| Al 改变 设计 | 人 工 智能 时 代 的 设计 师 生存 手册 


机 器 必须 具有 身体 ， 它 需要 有 感知 、 移 动 、 生 存 ， 与 这 个 世界 交 
互 的 能 力 。 感 知 运动 技能 对 于 常识 推理 等 高 层次 技能 是 至 关 重 要 
的 ， 基 于 对 事物 的 推理 能 力 比 抽象 能 力 更 为 重要 ， 这 也 促进 了 未 
来 自然 语言 、 机 器 视觉 的 发 展 。 





1.1.5 第 二 次 寒冬 (1987 一 1993 年 ) 


1987 年 ，AI 硬件 的 市 场 需求 突然 下 跌 。 科 学 家 发 现 ， 专 家 系 
统 虽 然 很 有 用 ， 但 它 的 应 用 领域 过 于 狭窄， 而 且 更 新 迭代 和 维护 
成 本 非常 高 。 同 期 美国 Apple 和 IBM 生产 的 台式 机 性 能 不 断 提升 ， 
个 人 计算 机 的 理念 不 断 蔓延 ， 日 本 人 设 定 的 “第 五 代 工程 ”最 终 
也 没 能 实现 。 人 工 智 能 研究 再 次 遭遇 了 财政 困难 ， 一 夜 之 间 这 个 
价值 五 亿美 元 的 产业 土崩瓦解 。 

当时 主要 问题 如 下 : 

(1) 大 型 计算 机 受到 台式 机 和 个 人 计算 机 理念 的 冲击 影响 。 

(2) 商业 机 构 对 人 工 智能 的 追捧 逐渐 冷落 ， 使 人 工 智能 再 次 
化 为 泡沫 并 破裂 。 

(3) 计算 机 性 能 瓶颈 仍然 无 法 突破 。 

(4) 人 工 智 能 研究 人 员 仍 然 缺 乏 海量 数据 训练 机 器 。 
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1.1.6 第 三 次 发 展 高 潮 (1993 年 至 今 ) 


在 摩尔 定律 ”下 ,计算 机 性 能 不 断 突破 。 云 计算 、 大 数据 、 机 














器 学 习 、 自 然 语言 和 机 器 视觉 等 领域 发 展 迅 速 ， 人 工 智能 迎 来 第 
三 次 高 潮 。 在 这 一 阶段 ，AI 发 展 的 主要 事件 如 下 。 

1997 年 : 

IBM 的 国际 象棋 机 器 人 “深蓝 ”战胜 了 曾经 23 次 获得 世界 排 
名 第 一 的 国际 象棋 世界 冠军 卡 斯 帕 罗 夫 (Garry Kasparov) 。 这 是 
一 次 具有 里 程 碑 意 义 的 成 功 , 它 代 表 了 基于 规则 的 人 工 智 能 的 胜利 。 

















卡 斯 帕 罗 夫 和 深蓝 机 器 人 博弈 





@ 摩尔 定律 : 起 始 于 高 登 。 摩尔 (Gordon Moore) 在 1965 年 的 一 个 预言 ， 当 时 他 看 
到 英特尔 公司 做 的 几 款 芯片 ， 觉 得 18 一 24 个 月 可 以 把 晶体 管 体 积 缩小 一 半 ， 个 数 
可 以 翻 一 番 ， 运 算 处 理 能 力 能 翻 一 倍 。 没 想到 这 么 一 个 简单 的 预言 成 真 了 ， 下 面 几 
十 年 一 直 按 这 个 节奏 往 前 走 ， 成 了 摩尔 定律 。 
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2005 年 : 

塞 巴 斯 蒂 安 . 特 伦 (Sebastian Thrun) ”带领 斯 坦 福 大 学 的 学 
生 制 造 了 一 台 无 人 驾驶 汽车 Stanley 并 参加 DARPA〈 美 国 国防 部 
高 级 研究 计划 所 ) 举办 的 无 人 驾驶 汽车 大 赛 ，Stanley 成 功 地 在 一 
条 沙漠 小 径 上 自动 行驶 了 131 英里 ， 也 是 比赛 以 来 第 一 辆 成 功 穿 
越 整 个 沙漠 回 到 起 点 的 汽车 ， 最 终 斯 坦 福 大 学 赢得 了 DARPA 挑 
战 大 赛 头 奖 和 两 百 万 美元 奖金 。 





EA 


ot eau 
A 8 
fk “ 





无 人 驾驶 汽车 Stanley 


2006 年: 
(1) 杰 弗 里 * 辛 顿 以 及 他 的 学 生 鲁 斯 兰 " 萨 拉 赫 丁 诺 夫 (Ruslan 





巴塞 巴 斯 蒂 安 。 特 伦 是 斯 坦 福 大 学 终身 教授 ， 机 器 人 与 人 工 智 能 领域 专家 ， 被 称 为 无 
人 驾驶 汽车 之 父 ， 同 时 他 也 是 Google X 实验 室 的 创始 人 、Google 街景 地 图 之 父 、 
Google Glass 之 父 ; 后 来 他 离开 Google 创立 了 在 线 教育 平台 Udacity, 是 MOOC ( 慕 
课 ) 教育 的 开创 者 之 一 。 
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Salakhutdinov) ”在 国际 顶级 期 刊 《 科 学 》 上 正式 提出 了 深度 学 习 
的 概念 ， 为 后 来 人 工 智能 的 发 展 带 来 了 重大 影响 。 

(2) Google 前 CEO 埃 里 克 。… 施 密 特 (Eric Schmidt) 在 搜索 
引擎 大 会 提出 “ 云 计算 ”概念 ， 并 表示 “ 云 计 算 ” 将 取代 传统 以 
PC 为 中 心 的 计算 。 

2010 年 : 

(1) 塞 巴 斯 蒂 安 " 特 伦 领导 的 谷歌 无 人 驾驶 汽车 被 曝光 ， 谷 
歌 的 无 人 驾驶 汽车 在 加 州 的 高 速 公路 和 弯曲 的 城市 街道 上 行驶 并 
创下 了 超过 14 万 干 米 无 事故 的 纪录 。 

(2) 斯 坦 福 大 学 任 助 理 教授 李 飞 飞 和 同事 在 2009 年 国际 计 
算 机 视觉 与 模式 识别 会 议 (Conference on Computer Vision and 
Pattern Recognition，CVPR) 的 一 篇 论文 中 推出 了 ImageNet 数据 
集 。 从 2007 一 2009 年 ，ImageNet 利用 人 工 、 互 联网 分 时 雇佣 平 
台 等 传统 方法 ， 收 集 了 超过 320 万 个 被 标记 的 图 像 ， 分 为 12 个 大 
类 别 以 及 5247 个 小 类 别 。ImageNet 数据 集 可 以 说 是 计算 机 视觉 
研究 人 员 进 行 大 规模 物体 识别 和 检测 时 最 常用 也 是 最 优先 考虑 的 
视觉 大 数据 来 源 。 从 2010 年 开始 ， 这 个 数据 集 迅速 发 展 成 为 一 项 
年 度 竞赛 一 一 ImageNet 大 规模 视觉 识别 挑战 赛 ( ImageNet Large 
Scale Visual Recognition Challenge，ILSVRC) ， 衡 量 哪些 算法 可 
以 以 最 低 的 错误 率 识 别 数据 集 图 像 中 的 物体 。 








Q@ ”和 鲁 斯 兰 。 萨 拉 赫 丁 诺 夫 在 2016 年 成 为 苹果 的 AI 研究 团队 负责 人 。 


一 011 


| Al 改变 设计 | 人 工 智 能 时 代 的 设计 师 生 存 手册 


2011 年 : 

(1) IBM Waston 参加 智力 游戏 《危险 边缘 》， 击 败 最 高 奖金 
得 主 布 拉 德 . 鲁 特 (Brad Rutter) 和 连 胜 纪录 保持 者 表 * 詹 宁 斯 (Ken 
Jennings) 。 

(2) 苹果 发 布 语音 个 人 助手 Siri， 用 户 可 以 使 用 自然 的 对 话 
与 手机 进行 交互 ， 完 成 搜索 数据 、 查 询 天 气 、 设 置 手机 日 历 、 设 
置 闹 铃 等 许多 服务 。 

(3) Nest Lab 发 布 第 一 代 智 能 恒温 器 Nest， 它 可 以 了 解 用 户 
的 习惯 ， 并 相应 自动 地 调节 温度 。 

















第 一 代 智能 恒温 器 Nest 


2012 年: 

(1) Google 发 布 了 个 人 助理 Google Now，Google Now 为 
Google 搜索 应 用 程序 的 一 部 分 ， 它 可 以 识别 用 户 在 设备 上 重复 的 
动作 ， 例 如 常见 的 位 置 、 重 复 的 日 历 活动 、 搜 索 历 史 等 ， 并 以 卡 
片 的 方式 向 用 户 提供 相关 信息 。 
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(2) 杰 夫 。 迪 因 (Jeff Dean) 和 吴 恩 达 “领导 了 “谷歌 
大 脑 ” 项 目 ， 通 过 深度 学 习 技 术 让 16000 个 中 央 处 理 器 核心 学 
习 1000 万 张 关于 猫 的 图 片 后， 成 功 在 海量 Youtube 视频 中 识 
别 出 猫 的 图 像 ， 这 次 成 功 被 大 众 认 为 是 人 工 智能 领域 真正 的 里 
程 碑 。 

(3) 在 ILSVRC 2012 中 ,多 伦 多 大 学 的 杰 弗 里 。 辛 顿 (Geoffrey 
Hinton) 和 他 的 两 名 学 生 提 交 了 一 个 名 为 AlexNet 的 深度 卷 积 神 

经 网 络 架构 ， 使 图 像 识别 错误 率 降 低 至 10.8%， 获 得 了 当年 竞赛 
的 第 一 名 。 同时 , 卷 积 神经 网 络 的 效果 震惊 了 整个 计算 机 视觉 界 ， 
成 为 业界 里 家 喻 户 晓 的 名 字 。 

(4) 上 文 提 及 的 AlexNet 仅 在 2 块 英 伟 达 GTX 580 GPU 上 训 
练 几 天 就 赢得 了 ILSVRC 2012 的 冠军 ， 极 大 地 降低 了 时 间 和 硬 
件 成 本 。 这 件 事 引起 了 世界 各 地 的 人 工 智能 研究 人 员 的 关注 ， 用 
GPU 来 训练 模型 使 得 深度 学 习 技术 得 以 迅速 发 展 。 英 伟 达 也 凭借 





@ 杰 夫 。 迪 恩 是 谷歌 的 第 20 号 员工 ， 被 称 为 谷歌 技术 奠基 人 ， 他 是 谷歌 大 脑 、 谷 歌 
机 器 学 习 开源 框架 TensorFlow、 谷 歌 超 大 规模 计算 框架 MapReduce、 谷 歌 广 告 系统 、 
谷歌 搜索 系统 等 技术 的 重要 创始 人 之 一 。2018 年 ， 杰 夫 。 迪 恩 升任 为 Google AI 总 
负责 人 。 

@ 吴 恩 达 是 斯 坦 福 大 学 副教授 和 斯 坦 福 人 工 智能 实验 室 主任 ， 他 开设 的 机 器 学 习 
课程 成 为 斯 坦 福 最 受 欢迎 课程 之 一 。2010 年 吴 恩 达 加 入 了 Google， 领 导 建 立 
了 著名 的 谷歌 大 脑 ; 2013 年 吴 恩 达 入 选 《 时 代 》 杂 志 年 度 全 球 最 有 影响 力 100 
人 ， 成 为 16 位 科技 界 代表 之 一 ; 2014 年 吴 恩 达 加 入 百度 被 任命 为 百度 首席 科 
学 家 ， 负 责 百 度 大 脑 计划 ; 在 2017 年 ， 吴 恩 达 离开 百度 后 在 Coursera 上 公布 了 
DeepLearning.ai 深度 学 习 系列 课程 ， 同 时 他 也 是 在 线 教育 平台 Coursera 的 联合 创 
扩大 之 二 
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其 CUDA 平台 一 飞 冲天 ， 后 续 凭借 自己 领先 的 GPU 技术 迅速 在 
自动 驾驶 、 数 据 中 心 、 视 觉 计 算 、 边 缘 计算 等 领域 攻 城 略 地 ， 成 
为 人 工 智能 领域 最 炙手可热 的 明星 企业 。 

2013 年 : 

深度 学 习 算 法 在 语音 和 视觉 识别 率 上 获得 突破 性 进展 。 

2014 年 : 

(1) 微软 亚洲 研究 院 发 布 人 工 智能 聊天 机 器 人 小 冰 和 语音 
手 Cortana， 小 冰 可 以 在 微 博 、 微 信 等 平台 上 为 用 户 提供 天 气 、 交 
通 、 星 座 等 信息 搜索 服务 ， 而 Cortana 被 用 于 Windows 设备 上 ， 
它 会 根据 用 户 行为 和 使 用 习惯 给 出 不 同 的 响应 。 

(2) 百度 发 布 了 Deep Speech 语音 识别 系统 ， 它 可 以 在 饭店 
等 嘲 杂 环境 下 实现 将 近 81% 的 辨识 准确 率 ， 高 于 Google、Bing 
等 竞争 对 手 。 

(3) 斯 坦 福 大 学 人 工 智能 实验 室 主任 李 飞 飞 主导 的 科学 家 团 
队 开 发 了 一 个 机 器 视觉 算法 ， 该 算法 能 够 通过 对 图 像 进行 分 析 ， 
然后 用 语言 对 图 像 中 的 信息 进行 描述 ， 例 如 两 个 人 在 公园 里 玩 飞 
盘 等 。 

(4) 微软 CEO 萨 提 亚 。 纳 德 拉 〈Satya Nadella) 在 首届 Code 
大 会 中 介绍 了 全 新 Skype 语音 翻译 工具 ， 该 工具 能 够 对 完整 对 话 
实现 语音 到 语音 的 实时 翻译 。 

(5) 亚马逊 发 布 了 个 人 语音 智能 助理 Alexa， 并 用 于 刚 发 售 
的 蓝牙 音箱 Echo 上 。 
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2015 年 : 

(1) Facebook 发 布 了 一 款 基 于 文本 的 人 工 智 能 助理 M ，M 
可 以 在 Facebook Messenger 上 为 用 户 提供 餐厅 订 位 、 选 生日 礼物 、 
挑选 周末 假期 等 服务 。 

(2) Google 发 布 了 开源 深度 学 习 系 统 TensorFlow 0.1 版 本 。 

(3) 新 发 布 的 第 三 代 微软 小 冰 被 定义 为 17 岁 的 高 中 女生 ， 拥 
有 了 全 新 的 人 工 智能 感官 系统 和 微软 多 项 人 工 智 能 图 像 与 语音 识 
别 技术 。 根 据 微软 公布 的 统计 数字 显示 ， 人 类 用 户 与 小 冰 的 平均 
每 次 对 话 轮 数 达 到 18 轮 ， 而 当前 同类 机 器 人 的 平均 对 话 轮 数 仅 有 
15 2 各: 

(4) 百度 发 布 了 新 一 代 深 度 学 习 语音 识别 系统 Deep Speech 2， 
汉语 识别 准确 率 高 达 97%， 被 《 麻 省 理工 科技 评论 》 入 选 为 2016 
年 “全 球 十 大 突破 性 技术 ”。 

(5) Google 发 布 了 深度 学 习 高 级 API 一 一 Keras， 它 能 够 在 
TensorFlow、Theano 等 多 个 深度 学 习 框架 上 运行 ， 其 易 用 性 和 语 
法 简洁 性 大 大 降低 了 深度 学 习 的 学 习 成 本 。 从 发 布 至 今 ， 有 数 以 
百 计 的 开发 人 员 对 Keras 的 开源 代码 做 了 完善 和 拓展 ， 数 以 干 计 
的 热心 用 户 在 社区 对 Keras 的 发 展 做 出 了 贡献 ，Keras 深 受 开发 者 
的 欢迎 。 

2016 年 : 

(1) Google AlphaGo 以 比分 4 :1 战胜 围棋 九段 棋 手 李 
世 石 。 
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(2) Google 发 布 了 第 一 代 专 门 为 深度 学 习 框 架 TensorFlow 
设计 的 AI 专用 芯片 TPU， 它 的 处 理 速度 要 比 CPU 和 GPU 快 
15 ~ 30 倍 9， 而 在 能 效 上 ，TPU 更 是 提升 了 30 ~ 80 倍 。 

(3) Google 发 布 了 AI 语音 助手 Google Assistant， 它 被 运用 
在 Pixel 手机 、Google Home 智能 音箱 和 聊天 应 用 Allo 上 。 

(4) 在 2016 年 微软 开发 者 峰会 上 , 微软 发 布 了 微软 认 知 服务 ， 
包括 了 视觉 、 语 音 、 语 言 、 知 识 和 搜索 五 个 方面 ， 协 助 第 三 方 开 
发 者 用 简单 的 代码 实现 自己 的 智能 应 用 。 

(5) 微软 发 布 了 第 四 代 微 软 小 冰 ， 她 整合 了 全 新 的 情感 计算 
框架 和 实时 流 媒 体感 官 ， 可 以 做 到 通过 文本 、 图 像 、 视 频 和 语音 
与 人 类 展开 交流 ， 平 均 对 话 轮 数 上 升 至 25 轮 。 同 时 ， 小 冰 积 累 的 
大 数据 促使 小 冰 在 人 工 智 能 虚拟 歌手 领域 取得 了 重大 突破 ， 微软 
宣布 小 冰 正 式 进入 虚拟 歌手 市 场 。 

(6) 聊天 机 器 人 〈Chatbots) 概念 开始 在 欧美 地 区 流行 。 

(7) Google 旗下 的 DeepMind 发 布 了 最 新 的 原始 音频 波形 深 
度 生成 模型 WaveNet， 它 能 够 通过 深度 神经 网 络 为 任何 音频 进行 
建 模 ， 生 成 的 语音 非常 自然 。 

(8) Google、Facebook、IBM、 亚 马 逊 和 微软 共同 宣布 成 立 

家 非 营利 机 构 一 -Partnership on AI， 其 成 立 的 目的 是 汇集 全 球 
不 同 的 声音 ， 以 保障 AI 在 未 来 能 够 安全 、 透 明 、 合 理 地 发 展 ， 让 
世界 更 好 地 理解 人 工 智能 的 影响 。 随 着 机 构 的 发 展 , 苹果 、 英特尔 、 














@ 和 第 一 代 TPU 对 比 的 是 英特尔 Haswell CPU 以 及 英 伟 达 Tesla K80 GPU。 
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索尼 、 百 度 等 AI 领头 企业 陆续 加 入 其 中 。 

2017 年 : 

(1) Google 正式 发 布 了 开源 深度 学 习 系统 TensorFlow 1.0 和 
面向 移动 设备 的 TensorFlow Lite 预览 版 ， 极 大 降低 了 人 工 智能 应 
用 的 开发 成 本 。 

(2) Google AlphaGo Master 在 围棋 网 络 对 战 平台 以 60 连 胜 击 
败 世 界 各 地 高 手 ， 并 以 比分 3 : 0 完胜 世界 第 一 围棋 九段 棋 手 柯 洁 。 
随后 的 新 版 本 Google AlphaGo Zero 不 借助 人 类 玩家 的 棋谱 ， 完 
忽略 几 干 年 以 来 人 类 积累 的 围棋 智慧 ， 通 过 自我 对 弈 方式 进行 自 
我 学 习 。 三 天 内 AlphaGo Zero 自我 对 弈 490 万 局 并 以 100 : 0 的 
战绩 战胜 了 AlphaGo， 花 了 21 天 达到 AlphaGo Master 的 水 平 ， 
用 40 天 超越 了 所 有 旧版 本 。 在 2017 年 底 ，DeepMind 又 发 布 了 
AlphaGo 的 后 续 版 本 一 一 AlphaZero， 它 比 之 前 的 AlphaGo Zero 
更 为 强大 的 地 方 在 于 它 能 适用 于 各 种 棋 类 上 。AlphaZero 从 零 开始 
训练 ，4 小 时 就 打败 了 国际 象棋 的 最 强 程 序 Stockfish; 2 小 时 就 打 
败 了 日 本 将 棋 的 最 强 程序 Elmo; 8 小 时 就 打败 了 与 李 世 石 对 战 的 
AlphaGo v18。 

(3) Google 在 开发 者 大 会 上 发 布 了 AutoML、ARCore SDK 
和 Google Lens。Google Lens 可 以 根据 图 片 或 拍照 识别 出 文本 和 
物体 , 实时 分 析 图 像 并 迅速 共享 信息 , 这 意味 着 计算 机 “识别 万 物 ” 
的 愿景 即将 到 来 。Google Assistant 在 语音 、 文 字 和 图 像 三 大 方面 
都 有 多 项 更 新 ， 并 投入 使 用 到 计算 机 、 手 表 、 电 视 、 车 载 系统 等 安 
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卓 设 备 上 。 

(4) Google 发 布 了 第 二 代 专 用 AI 芯片 TPU。 除 了 速度 有 所 
提升 ， 相 比 只 能 做 推理 的 初代 TPU，TPU 2.0 既 可 以 用 于 训练 神 
经 网 络 ， 又 可 以 用 于 推理 。 

(5) 卡耐基 梅 隆 大 学 开发 的 人 工 智能 系统 Libratus 战胜 4 位 
德州 扑克 项 级 选手 ， 并 获得 了 最 终 胜利 ， 这 意味 着 计算 机 在 “ 非 
完整 信息 博弈 ”上 超越 了 人 类 。 

(6) 百度 在 AI 开发 者 大 会 上 正式 发 布 语 音 系统 Dueros 和 无 
人 自动 驾驶 平台 Apollo 1.0。 

(7) 华为 发 布 全 球 第 一 款 AI 移动 芯片 麒麟 970， 集 成 了 中 国 
AI 芯片 公司 寒 武 纪 提供 的 NPU 寒 武 纪 A1， 在 人 工 智 能 应 用 上 达 
到 了 四 核 CPU 25 倍 以 上 的 性 能 和 50 倍 以 上 的 能 效 。 

(8) 默默 深耕 机 器 学 习 和 机 器 视觉 的 苹果 在 WWDC 2017 上 
发 布 Core ML、ARKit 等 组 件 。 随 后 发 布 的 iPhone X 配 备 前 置 
3D 感应 摄像 头 (TrueDepth) ， 脸 部 识别 点 达到 3 万 个 ， 具 备 人 
脸 识别 、 解 锁 和 支付 等 功能 ;配备 的 Al1 Bionic 神经 引擎 每 秒 可 
达到 运算 6000 亿 次 。 

(9) AR 领域 最 神秘 最 受 关注 的 创业 公司 Magic Leap 发 布 了 
消费 级 AR 眼镜 Magic Leap One。 

(10) 中 国 发 布 了 世界 第 一 款 量子 计算 机 。 量 子 计 算 机 可 以 突 
破 传统 计算 机 的 多 项 瓶颈 ， 提 供 更 快 的 运算 速度 ， 这 意味 着 我 们 
的 生活 方式 和 商业 模式 即将 有 翻天 覆 地 的 变化 。 
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(11) 第 五 代 微软 小 冰 拥 有 了 高 级 感官 系统 ， 包 括 全 新 的 全 双 
工 语音 交互 感官 (Full-duplex Voice Sense) @， 同 时 微软 小 冰 正 式 
进入 IoT 领域 ， 开 始 与 多 家 设备 厂商 进行 深度 合作 。 

(12) 计算 机 视觉 乃至 整个 人 工 智能 发 展 史 上 的 里 程 碑 一 一 
ImageNet 大 规模 视觉 识别 挑战 赛 于 2017 年 正式 结束 ， 图 像 识 别 
错误 率 降低 至 2.25%， 远 远 低 于 人 类 的 5.1%。 如 今 的 InageNet 
已 经 拥有 了 1500 万 张 标注 图 像 和 超过 2.2 万 个 类 别 ， 很 多 人 认为 
ILSVRC 是 如 今 席卷 全 球 AI 浪潮 的 催化 剂 。 

2018 年 (事件 更 新 至 2018 年 10 月 ) : 

(1) 芯片 制造 商 高 通 发 布 了 人 工 智能 引擎 AI Engine， 并 与 百 
度 、 商 汤 科技 等 多 家 AI 公司 进行 深度 合作 。 这 次 发 布 意味 着 全 球 
三 大 移动 芯片 提供 商 高 通 、 华 为 和 苹果 全 部 入 局 人 工 智能 领域 ， 
人 工 智 能 应 用 将 会 迎 来 新 的 浪潮 。 

(2) Google TPU 云 服务 以 每 小 时 6.5 美元 的 价格 正式 对 外 开放 ， 
这 意味 着 普通 开发 者 也 可 以 使 用 “谷歌 级 别 ” 的 人 工 智能 计算 能 力 。 

(3) 与 人 工 智能 相关 的 四 项 技术 包括 感知 城市 、 面 向 所 
有 人 的 人 工 智 能 、 对 抗 神经 网 络 和 巴 别 鱼 耳 塞 (实时 翻译 耳机 )》 
被 《 麻 省 理工 科技 评论 》 入 选 2018 年“ 全球 十 大 突破 性 技术 ”。 

(4) IBM、Intel 和 Google 相继 发 布 量子 计算 机 。Google 的 














人 ”微软 对 全 双 工 语音 交互 感官 技术 的 解释 为 :与 现 有 的 单 轮 或 多 轮 连 续 语音 识别 效果 
不 同 ， 全 双 工 语音 交互 感官 技术 可 实时 预测 人 类 即将 说 出 的 内 容 ， 实 时 生成 回应 
控制 对 话 节奏 ， 能 理解 对 话 场景 在 诉说 者 / 倾听 者 之 间 实 现 角色 转变 ， 还 可 以 识别 
说 话 人 的 性 别 、 有 几 个 人 在 说 话 。 
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通用 量子 计算 机 Bristlecone 拥有 72 个 量子 比特 ， 实 现 了 1% 的 低 
错误 率 并 有 机 会 实现 量子 霸权 。 

(5) 中 国 AI 芯片 公司 寒 武 纪 发 布 了 第 三 款 NPU“ 寒 武 纪 
1M”， 可 以 满足 不 同 场景 、 不 同 量 级 的 AI 处 理 需求 ， 可 广泛 应 
用 于 智能 手机 、 智能 音箱 、 智 能 摄像 头 和 智能 驾驶 等 不 同 领域 中 。 
“ 寒 武 纪 1M” 将 被 华为 麒麟 980 搭载 。 

(6) Google 在 开发 者 大 会 上 发 布 了 第 三 代 TPU， 性 能 比 第 二 
代 提 高 了 8 倍 。Google Assistant 新 增加 了 Google Duplex 技术 ， 
除了 可 以 理解 更 复杂 的 句子 外 ， 还 能 以 更 自然 的 人 声 以 及 更 接地 
气 的 对 话 方式 与 人 类 互动 。 

(7) 苹果 在 WWDC 2018 上 发 布 了 Core ML 2.0 和 ARKit 2.0。 
Core ML 2.0 比 第 一 代 速度 快 了 30%; ARKit 2.0 增加 了 增强 人 脸 
追踪 、 真 实感 图 形 绘制 、 多 用 户 AR 互动 等 新 功能 。 

(8) 百度 在 AI 开发 者 大 会 上 正式 发 布 云端 全 功能 AI 芯片“ 昆 
仑 ”、 百 度 大 脑 3.0、 语 音 系统 DuerOS 3.0、 无 人 自动 驾驶 平台 
Apollo 3.0。 

〈9) 微 软 人 工 智能 小 冰 迎 来 了 史上 最 大 幅度 的 一 次 年 度 升级 ， 
正式 进化 为 第 六 代 小 冰 。 全 新 的 小 冰 具 备 可 交互 的 3D 形象 ， 已 
经 从 一 个 领先 的 人 工 智 能 对 话机 器 人 ， 发 展 成 为 以 情感 计算 为 核 
心 的 完整 人 工 智 能 框架 。 小 冰 的 产品 形态 涉及 对 话机 器 人 、 语 音 
助手 、 内 容 创 造 提供 者 和 一 系列 垂直 领域 解决 方案 。 微 软 首次 披 














@ 量子 霸权 : 量子 计算 机 执行 某 个 任务 的 能 力 将 超越 最 好 的 超级 电子 计算 机 。 
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露 了 小 冰 在 全 球 已 拥有 6.6 亿 用 户 ， 占 据 了 全 球 对 话 式 人 工 智 能 
总 流量 中 的 绝 大 部 分 。 





第 六 代 微 软 小 冰 3D 形象 


(10) Google 在 谷歌 云 年 度 大 会 宣布 推出 Cloud AutoML 
Natural Language 与 Cloud AutoML Translation 两 大 工具 ， 加 上 此 
前 已 推出 的 Cloud AutoML Vision，AutoML 可 以 帮助 各 行业 缺少 
AI 经 验 的 企业 和 开发 者 建立 属于 自己 的 图 像 识 别 、 自 然 语言 处 理 
和 机 器 翻译 模型 。 

(11) Google 在 谷歌 云 年 度 大 会 第 二 天 宣布 推出 用 于 边缘 计 
算 的 Edge TPU 和 Edge ML。Edge TPU 可 以 以 超 低 功 率 的 方式 进 
行 机 器 学 习 推 理 ，Edge ML 是 TensorFlow Lite ML 工具 的 精简 版 ， 
在 本 地 运行 预先 训练 好 的 Edge ML 模型 ， 可 以 显著 提高 边缘 设备 
的 处 理 能 力 和 多 功能 性 。 后 续 有 更 多 的 智能 硬件 拥有 AI 的 能 
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(12) 苹果 新 发 布 的 iPhone XS 配 备 了 业界 首 款 7nm 也 是 
iPhone 迄今 最 智能 、 最 强大 的 芯片 A12 Bionic。 相 比 每 秒 可 以 处 
理 6 干 亿 次 操作 的 All Bionic， 新 版 本 芯片 每 秒 可 以 处 理 5 万 亿 
次 操作 。 

(13) IBM 在 旧金山 举办 了 一 场 人 机 辩论 大 战 ，IBM 最 新 人 
工 智 能 产品 Project Debater 与 两 位 经 验 丰 富 的 辩 手 Noa Ovadia 和 
Dan Zafrir 进行 较量 。Project Debater 在 两 场 由 观众 投票 的 辩论 中 
赢得 了 其 中 一 场 ， 辩 题 为 “是 否 应 该 增加 使 用 远程 医疗 ”。 最 重 
要 的 是 ， 这 是 第 一 个 展示 出 辩论 能 力 的 人 工 智能 系统 。 

(14) Google 发 布 了 面向 JavaScript 开发 者 的 全 新 机 器 学 习 框 
架 TensorFlow.js， 开 发 者 可 以 在 浏览 器 上 开发 以 及 运行 机 器 学 习 
模型 。 

(15) Facebook 在 F8 开发 者 大 会 上 发 布 了 深度 学 习 框 架 
PyTorch 1.0， 它 深度 整合 了 业界 最 流行 的 深度 学 习 框 架 Caffe2 

(Facebook 的 另外 一 款 深 度 学 习 框 架 ) ， 其 中 一 个 名 为 fastai 的 
开源 库 可 以 大 量 减少 深度 学 习 的 学 习 成 本 和 工作 量 ， 深 受 开发 者 
的 欢迎 。 

(16) Google 旗下 的 Waymo 开始 无 人 车 的 士 服 务 的 商业 化 
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1.2” 人 机 交互 的 发 展 历程 


人 工 智 能 和 人 机 交互 的 发 展 可 以 说 是 密 不 可 分 ， 相 辅 相 成 ; 
但 可 能 大 家 都 很 难 想 到 的 是 ， 在 60 年 前 ， 人 工 智 能 和 人 机 交互 基 
本 就 是 两 大 阵营 ， 水 火 不 容 ， 我 们 来 看 看 是 怎么 回 事 。 


1.2.1 人 工 智 能 与 智能 增强 


20 世纪 50 年 代 ， 两 位 先后 获得 了 图 灵 奖 的 学 者 在 麻 省 理工 
学 院 见面 , 他 们 分 别 是 马 文明 斯 基 (Marvin Minsky ) 和 格拉 斯 * 恩 
格 尔 巴 特 (Douglas Engelbart) 。 明 斯 基 曾 组 织 并 参与 达 特 茅 斯 会 
议 ， 他 和 约翰 。 麦 卡 锡 〈John McCarthy) 一 起 创立 了 麻 省 理工 学 
院 人 工 智 能 研究 室 ， 被 后 人 誉 为 “人 工 智 能 之 父 ”; 恩格尔 巴特 
曾 发 明 鼠 标 被 誉 为 “鼠标 之 父 ”, 他 先后 提出 的 邮件 、 超 文本 链接 、 
视窗 等 概念 对 人 机 交互 发 展 有 着 重大 影响 。 听 说 他 们 见面 后 产生 
了 以 下 争论 : 

明 斯 基 : “我 们 要 让 机 器 变 得 智能 ， 我 们 要 让 它们 拥有 意识 。” 

恩格尔 巴特 : “你 要 为 机 器 做 这 些 事 ? 那 你 又 打算 为 人 类 做 
些 什 么 呢 ? ” 

其 实 两 位 图 灵 奖 获得 者 来 自 计算 机 发 展 初 期 的 两 大 阵营 ， 明 
斯 基 代 表 的 是 人 工 智能 (Artificial Intelligence，AI) 阵营 ， 目 标 
是 要 创建 一 个 智能 机 器 来 取代 人 类 的 认 知 功能 和 能 力 ， 恩 格 尔 巴 
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特 代 表 的 是 智能 增强 (Intelligence Augmentation，IA) 阵营 ， 目 
标 是 要 将 智能 机 器 用 来 扩展 人 类 的 认 知 功能 和 能 力 。 两 大 阵营 的 
最 大 矛盾 在 于 设计 的 智能 机 器 是 否 要 基于 “以 人 为 本 ”， 归 根 到 
底 还 是 经 济 和 伦理 问题 : 智能 机 器 是 否 会 导致 人 类 失业 甚至 活 不 
瑟 去 5 

从 历史 来 看 ， 科 技 的 进步 使 人 类 的 效率 提高 ， 导 致 部 分 人 
失业 是 一 件 非 常 正 常 的 事情 ， 但 这 次 革新 的 科技 将 会 是 一 款 具 
备 甚 至 超越 人 类 能 力 的 智能 机 器 ， 而 这 个 愿景 可 能 会 对 人 类 和 
社会 产生 巨大 的 正面 以 及 负面 影响 ， 所 以 引起 了 两 个 阵营 的 热 
烈 争论 。 

其 实 AI 和 IA 两 个 阵营 做 的 研究 都 是 使 计算 机 更 聪明 ， 除 了 
争论 是 否 基 于 “以 人 为 本 ”来 设计 机 器 外 ， 最 主要 的 矛盾 其 实 是 
时 间 问 题 : 机 器 拥有 甚至 超越 人 类 的 能 力 几时 到 来 ? 人 工 智 能 阵 
营 的 约翰 。 麦 卡 锡 认 为 取代 人 类 的 技术 会 在 20 世纪 70 年 代 实 现 ， 
但 由 于 技术 瓶颈 的 限制 ， 这 个 目标 过 了 50 年 仍 未 实现 。 

所 谓 “ 当 局 者 迷 ， 旁 观 者 清 ”， 麦 卡 锡 和 恩格尔 巴特 的 早期 
资助 者 约瑟夫 。 利 克 莱 德 (J.C.R.Licklider) 认为 : 智能 机 器 在 达 
到 甚至 超越 人 类 能 力 之 前 ， 需 要 处 理 好 与 人 类 的 关系 ; 人 机 交互 
是 智能 机 器 前 进 过 程 中 的 一 个 过 渡 阶 段 。 

由 于 各 种 技术 瓶颈 的 限制 ， 研 究 人 工 智 能 的 历程 相当 坎坷 ，AI 
阵营 大 大 小 小 经 历 了 两 次 寒冬 ， 在 某 些 年 代 他 们 基本 拾 不 起 头 来 。 
而 IA 阵营 却 不 一 样 ， 基 于 恩格尔 巴特 提出 的 CoDIAK (Concurrent 
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Development，Integration，and Application of Knowledge， 对 知识 
进行 合作 开发 、 集 成 和 应 用 ) 概念 框架 的 进一步 延伸 和 拓展 ， 人 
机 交互 技术 得 以 快速 发 展 。 可 以 认为 ， 计 算 机 的 几 次 革命 和 大 规 
模 普 及 都 离 不 开 于 人 机 交互 的 改变 和 创新 ， 人 工 智能 也 受益 于 这 
几 次 技术 的 变革 。 





1.2.2 人 机 交互 发 展 的 主要 事件 


1960 年 ， 约 瑟 夫 。 利 克 莱 德 设计 了 互联 网 的 初期 架构 一 一 以 
宽带 通信 线路 连接 的 计算 机 网 络 ， 目 的 是 实现 信息 存储 、 提 取 以 
及 实现 人 机 交互 的 功能 ， 这 个 思想 的 创新 性 是 继 电 话 网 络 、 电 报 
网 络 、 无 线 电网 络 之 后 ， 催 生 了 以 计算 机 联机 为 主 的 第 四 网 络 。 
同年 ， 利 克 莱 德 提出 了 “人 机 共生 ” (Man-Machine Symbiosis) 

念 ， 被 视 为 人 机 界面 学 的 启蒙 观点 。 

1962 年 ， 轧 格 尔 巴特 发 表 了 论文 《提升 人 类 智能 : 一 个 概念 
性 的 框架 》， 呈 现 了 依靠 技术 管理 信息 、 帮 助人 们 互相 合作 来 解 
决 世界 经 济 和 环境 问题 的 蓝图 。 可 以 认为 ， 后 来 人 机 交互 阵营 实 
现 的 各 种 技术 例如 视窗 、 鼠 标 、 互 联网 ， 再 到 语音 交互 ， 基 本 停 
留 在 恩格尔 巴特 这 个 理论 框架 中 。 

1963 年 ， 计 算 机 图 形 学 之 父 伊 凡 。 苏 泽 兰 (Ivan Sutherland) 
在 麻 省 理工 的 博士 论文 项 目 “ 画 板 ”(Sketchpad〉 帮助 图 形 、 交 
互 式 计算 向 前 大 步 迈 进 。 
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1964 年 ， 轧 格 尔 巴特 发 明 的 鼠标 极 好 地 解决 了 人 们 在 图 形 化 
计算 机 界面 操纵 屏幕 元 素 的 问题 ， 为 互动 式 计 算 奠定 了 基础 ， 因 
此 被 IEEE 列 为 计算 机 诞生 50 年 来 最 重大 的 事件 之 一 。 

1965 年 ， 伊 凡 。 苏 泽 兰 提出 了 虚拟 现实 这 个 想法 ， 被 后 人 称 
为 “VR 之 父 ”。 三 年 后 ， 他 与 鲍 勃 。 斯 普 劳 尔 (Bob Sproull) 
合作 开发 了 一 人 台 名 为 “ 达 摩 克利 斯 之 剑 ” (Sword of Damocles) 
的 原型 机 ， 这 是 世界 上 的 第 一 款 VR/AR HMD (head-mounted 
display) 系统 。 虽 然 过 重 的 达 摩 克利 斯 之 剑 只 能 镶 和 在 天 花 板 上 ， 
但 VR/AR 设备 开始 出 现实 物 的 纵 形 。 





达 摩 克利 斯 之 剑 原 型 机 


1968 年 ， 恩 格 尔 巴 特 开发 了 世界 上 第 一 个 标准 化 的 编辑 器 
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NIB， 并 向 1000 多 名 全 世界 最 顶尖 的 计算 机 精英 进行 展示 ， 这 次 
的 展示 包括 了 鼠标 、 多 媒体 和 视频 远程 会 议 ， 展 示 效 果 泰 动 了 全 
场 。 此 外 ， 轧 格 尔 巴 特 还 提出 了 超 文 本 链接 、 电 子 邮 件 、 电 子 出 
版 、 多 窗口 计算 机 显示 器 等 概念 ， 他 的 实验 室 为 美国 政府 开发 出 
ARPANet 网 络 〈 即 互联 网 的 前 身 ) ， 硕 果 累 累 的 他 被 誉 为 “计算 
机 用 户 界面 设计 方案 中 提出 最 佳 思路 之 人 ”。 为 了 表彰 恩格尔 巴 
特 在 人 机 交互 领域 的 开拓 式 贡献 , 恩格尔 巴特 在 1997 年 获得 了 “ 计 
算 机 界 的 诺 贝尔 奖 ” 一 一 图 灵 奖 。 

1969 年 ， 在 英国 剑桥 大 学 召开 了 第 一 次 人 机 系统 国际 大 会 ， 
同年 第 一 份 专业 杂志 《国际 人 机 研究 》 (IJMMS) 创刊 。 可 以 说 ， 
1969 年 是 人 机 界面 学 发 展 史 的 里 程 碑 。 

1970 年 ， 相 关 学 者 成 立 了 两 个 人 机 交互 研究 中 心 : 一 个 是 英 
国 的 Loughborough 大 学 的 HUSAT 研究 中 心 ， 另 一 个 是 美国 施乐 
公司 的 Palo Alto 研究 中 心 (PARC) 。 

1973 年 ， 美 国电 报 电话 公司 (AT&T) 发 明了 一 个 新 概念 ， 
名 叫 “ 蜂 窝 网 络 ” (Cellular Network) ， 它 通过 无 线 通道 将 终端 
和 网 络 设备 连接 起 来 。 同 年 ， 摩 托 罗拉 实验 室 的 领导 者 马丁 。 库 
帕 (Martin Cooper) 率先 研发 出 推 向 民用 的 移动 电话 ， 被 后 人 称 
为 “移动 电话 之 父 ”。 手 机 的 诞生 意味 着 用 户 可 以 随时 随地 与 朋 
友 通 信 ， 为 后 续 移 动 互联 网 埋 下 伏笔 。 

1973 年 ， 施 乐 PARC 研究 中 心 推出 了 世界 上 第 一 款 拥有 图 
形 界面 的 Alto 计算 机 ， 从 此 开启 了 计算 机 图 形 界面 的 新 纪元 ， 
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人 机 交互 正式 进入 GUI(Graphical User Interface, 图 形 用 户 界 面 ) 
时 代 。 


System Browser 





Collections-Sequer — 





Collections-Text |iInterval accessing 

Collections-Arrayel LinkedList copying 3 
Collections-Stream MappedCollection | adding do:andBetweenDo: 
Collections-Suppor| OrderedCollection | removing promoteFirstSuchT 
Graphics-Primitive SortedCollection |/enumerating reverse 


------------ private revers 


select: |Form Editor 
Graphics-Paths oo |------ 
instance]| class 


collect: aBlock 7 
Evaiuate aBiock with each of my elements as the argument, d| CA 9.7 


resulting valyves into wu collection that is like me, Answer with ® 

















Collection, Override superciQss in order to use add:, not at:put’;, 


| newCollection | 

newCollection + self species new 

self do: [:each | newCollection add: (aBlock value: each)] 
+*newCollection 





User Interrupt 
Paragraph>>characterBlockAtPoint' 





Paragraph>>mouse5elect'ito: 
GodeController(ParagraphEditor)>>processRedButton 9 
CodeController(ParagraphEditor)>>processMouseButtons > 


COdeControlertparadrsphedtor) ontrolActivity 
CodeController(Controllem)>>controlLoop 


controlActivity 
self scrollBarGontainsCursor 2 
ifTrue 
[self scroll] 
ifFalse: 2 
[self processKeybo| [JRobson>SF>” 









self processMoused [Filene ]<Robson>SF>ScreenForm,st yy 
[Filene]<Robson>SF>ScreenFormChanges.s 3 Gg 
blueButtd 1@537 corner: [Filene ]<Robson>SF> WordGraphics.form 
ollBar 63@770 |------------ 
marker | ~ F 本 
savedAr = 
paragrap| 
startBlo 
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1983 年 ， 美 国 宇航 局 NASA 开发 了 一 款 用 于 火星 探测 的 虚 
拟 环境 视觉 显示 器 VIVED VR， 其 作用 是 训练 增强 宇航 员 的 临场 
感 ， 使 其 在 太空 能 够 更 好 地 工作 。 相 比 起 “ 达 摩 克利 斯 之 剑 ”， 
VR 设备 体积 逐渐 减 小 并 能 四 处 移动 。 








用 于 火星 探测 的 虚拟 环境 视觉 显示 器 VIVED VR 


1990 年 ，VR 先行 者 杰 伦 ， 拉 尼 尔 (Jaron Lanier) 创办 了 
VR 公司 VPL Research， 面 向 民用 市 场 推 出 了 一 系列 VR 设 
备 ， 包 括 了 VR 手套 Data Glove、VR 头 显 Eye Phone、 环 绕 
音响 系统 AudioSphere、3D 引擎 Issac、VR 操作 系统 Body 
Electric 等 。 尽 管 技 术 不 成 熟 、 硬 件 成 本 高 等 一 系列 原因 导致 
VR 产品 得 不 到 市 场 的 认可 ， 但 为 未 来 的 VR 发 展 奠定 了 良好 
的 理论 基础 。 
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Eye Phone 和 Data Glove 


1980 一 1995 年 ， 苹 果 、IBM、 微 软 等 大 公司 相继 推出 自己 的 
图 形 界 面 系统 ， 最 终 微 软 推出 的 Windows 95 赢得 了 大 部 分 市 场 份 
额 ， 微 软 从 此 走 上 帝国 之 路 。 


Welcome to Windows 


9 Did you know, 


Wh na progiam, you st chck the Start 
and Ihen chek the Programis on. 











加 5tart [waicome E18PM 
Windows 95 使 用 界面 
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1992 年 ， 李 开 复 博士 在 媒体 上 演示 了 一 个 名 叫 Casper 的 语 
音 助理 ， 这 个 语音 助理 实现 了 用 语音 直接 输入 文字 ， 更 改 字 号 、 
字体 ， 变 换 艺 术 字样 式 , 打开 /退出 计算 机 程序 , 操作 程序 等 功能 。 

1993 年 ， 苹 果 推 出 掌上 计算 机 (PDA,， 个 人 数位 助理 ) 
Apple Newton Messagepad， 它 能 给 用 户 带 来 触 控 屏 、 红 外 线 、 手 
写 输 入 等 一 些 颇具 未 来 主义 风格 的 人 机 交互 功能 。 苹 果 前 CEO 约 
翰 。 斯 考 利 〈John Sculley) 希望 未 来 计算 机 也 能 够 放 到 口袋 ， 融 
入 大 世界 中 。 同 年 ，IBM 公司 在 推出 了 Simon 手机 ， 它 结合 了 手 
机 和 PDA 的 功能 特点 ， 并 且 首 次 内 置 了 一 块 触摸 屏 ， 尽 管 早期 触 
摸 屏 的 触感 实在 是 很 差 。 





Apple Newton Messagepad 


1997 年 ， 飞 利 浦 公司 推出 数字 化 智能 手机 ， 能 够 无 线 接 入 电 
子 邮件 、 互 联网 和 传真 。 这 意味 着 用 户 可 以 在 户外 随时 随地 接收 
网 络 信息 ， 为 移动 互联 网 埋 下 伏笔 。 
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1997 年 飞利浦 推出 的 智能 手机 


1997 年 ， 哥 伦比 亚 大 学 的 斯 蒂 文 。 费 恩 纳 (Steven Feiner) 
发 布 了 世界 第 一 个 室外 移动 增强 现实 系统 Touring Machine。 这 套 
系统 包括 一 个 带 有 完整 方向 追踪 器 的 透视 头 戴 式 显 示 器 ; 一 个 捆 
绑 了 计算 机 、DGPS 和 用 于 无 线 网 络 访问 的 数字 无 线 电 的 背包 ; 
一 人 台 配 有 光 笔 和 触 控 界 面 的 手持 式 计算 机 。 这 意味 着 计算 机 从 室 
内 走向 室外 并 实时 获取 真实 空间 信息 。 





The Touring Machine System 


ee 
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1999 年 ， 世 界 第 一 款 AR 开源 工具 ARToolKit 问世 了 。 这 
个 开源 工具 由 奈良 先端 科学 技术 学 院 (Nara Institute of Science 
and Technology) 的 加 蕨 弘 〈Hirokazu Kato) 开发 ， 可 以 识别 和 追 
踪 一 个 黑白 的 标记 (Marker) ， 并 在 黑白 标记 上 显示 3D 图 像 。 
ARToolKit 的 出 现 使 得 AR 技术 不 仅仅 局 限 在 专业 的 研究 机 构 之 
中 , 许多 普通 程序 员 也 都 可 以 利用 ARToolKit 开发 自己 的 AR 应用。 
这 意味 着 人 机 交互 开始 从 二 维 界面 转向 三 维 空间 。 














ARToolKit 和 黑白 标记 


2000 年 ， 交 互 式 语音 应 答 (Interactive Voice Response, IVR) 
诞生 ， 电 话 用 户 只 要 拨打 移动 运营 商 所 指定 号 码 ， 就 可 根据 语音 
操作 提示 收听 、 点 播 或 发 送 语音 信息 ， 以 及 使 用 聊天 交友 等 互动 
式 服 务 。 一 些 银行 、 信 用 卡 中 心 等 商业 机 构 也 会 通过 IVR 技术 为 
电话 用 户 提供 自动 化 电话 查询 服务 ， 例 如 户口 余额 查询 、 转 账 、 
更 改 密码 。 
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2002 年 ， 手 机 和 WAP 技术 逐渐 成 熟 ， 更 多 的 功能 手机 开始 
配备 网 页 浏览 器 、 电 子 邮 件 、 摄 像 头 和 视频 游戏 等 功能 。 当 时 最 
出 名 的 Symbian 操作 系统 被 广泛 应 用 在 不 同 的 功能 手机 上 ， 为 移 
动 互联 网 奠定 了 良好 基础 。 





Danger Hiptop 


2004 年 ，Web 2.0 成 为 主流 并 提出 了 “应 用 软件 构建 在 互联 
网 ”这 个 概念 。Facebook、Youtube 等 社交 、 视 频 网 站 的 相继 推出 ， 
人 们 使 用 互联 网 的 时 间 逐 渐 增多 , 人 机 交互 正式 进入 互联 网 时 代 。 
这 次 变革 意味 着 用 户 大 部 分 数据 都 沉淀 到 每 个 大 公司 数据 平台 上 ， 
为 人 工 智能 发 展 英 定 了 基础 。 
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2006 年 ， 日 本 游戏 公司 任天堂 推出 了 新 世代 游戏 机 Wii， 它 
比 起 其 他 游戏 主机 多 了 一 个 最 具有 创新 性 的 硬件 设备 一 一 Wii 游戏 
手柄 ， 它 通过 运动 传感器 简单 识别 玩家 的 手臂 动作 ， 大 大 提高 了 游 
戏 的 可 玩 性 和 互动 性 。 

2007 年 ， 苹 果 公 司 首 席 执行 官 史 蒂 夫 。 乔 布 斯 (Steve 
Jobs) 在 旧金山 发 布 了 iPhone 和 iOS。 

2008 年 ，Google 发 布 了 开源 移动 操作 平台 Android。iPhone 
和 Android 的 多 点 触 控 和 传感器 概念 彻底 改变 了 手机 的 人 机 交互 
方式 ， 逐 渐 完善 的 用 户 体 验 和 不 断 增加 的 新 功能 使 人 们 使 用 手机 
的 时 间 越 来 越 长 。 这 次 变革 使 人 类 每 天 产生 的 数据 发 生 了 爆炸 性 
增长 ， 人 工 智能 即将 回 到 人 们 的 视野 。 

2009 年 ， 微 软 针 对 游戏 主机 Xbox 360 推出 了 体感 周边 外 设 
Kinect， 它 是 一 款 3D 体感 摄影 机 ， 拥 有 即时 动态 捕捉 、 影 像 辨 识 、 
麦克 风 输 入 、 语 音 辨 识 、 社 群 互动 等 功能 。 玩 家 可 以 通过 Kinect 
在 游戏 中 跳舞 或 者 运动 ， 以 及 通过 互联 网 和 其 他 玩家 进行 语音 
动 。 这 意味 着 人 类 可 以 在 三 维 空间 里 通过 动作 、 手 势 和 语音 等 方 
式 与 计算 机 进行 交互 。 

2011 年 ， 苹 果 发 布 了 语音 助手 Siri?， 随 后 几 年 里 Google、 亚 
马 逊 和 百度 相继 发 布 了 Google Assistant、Alexa 和 DuerosOS， 
语音 交互 时 代 已 经 来 临 。 语 音 交互 依赖 于 人 工 智 能 旗下 的 自然 语 
言 处 理 技术 ， 这 说 明了 新 的 人 机 交互 变化 也 依赖 于 人 工 智能 技术 
的 成 熟 。 
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2012 年 ，Google 革命 性 产品 Google Glass 开始 测试 ， 它 意 
味 着 增强 现实 和 脱离 双手 操作 的 人 机 交互 时 代 即 将 到 来 。 可 惜 的 
是 ，Google Glass 上 市 后 在 检验 市 场 需 求 的 同时 也 由 于 自身 的 诸 
多 不 足 而 遭遇 了 失败 (2017 年 Google Glass 项 目 重新 启动 并 专注 
于 企业 行业 应 用 ) 。 

2013 年 : 

(1) 体感 控制 器 制造 公司 Leap 发 布 了 体感 控制 器 Leap 
Motion， 它 可 以 以 超过 每 秒 200 帧 的 速度 追踪 全 部 10 只 手指 ， 精 
度 高 达 0.01 毫米 。 这 意味 着 人 通过 手势 识别 与 计算 机 进行 交互 的 
精确 度 上 升 到 一 个 新 的 高 度 。 





观看 视频 了 解 更 多 


Leap Motion 
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(2) 加 拿 大 创业 公司 Thalmic Labs 推出 了 手势 控制 臂 环 MYO 
腕 带 。 与 其 他 通过 相机 技术 追踪 用 户 手势 不 一 样 的 是 ，MYO 是 通 
过 探测 用 户 肌肉 产生 的 电 活 动 来 感知 用 户 的 动作 ， 官 方 声称 MYO 
腕 带 对 手势 的 捕捉 速度 非常 快 ， 有 时 候 你 甚至 会 觉得 自己 的 手 还 
没 开 始 动 MYO 就 已 经 感受 到 了 。 相 比 Kinect 和 Leap Motion， 
MYO 的 优势 在 于 不 受 具体 场地 的 限制 ， 可 以 更 自然 、 更 直观 地 控 
制 数 字 世 界 。 随 着 成 本 的 降低 ， 通 过 电 活 动 判断 用 户 意图 这 项 技 
术 将 会 对 下 一 轮 人 机 交互 变革 带 来 巨大 的 影响 。 





观看 视频 了 解 更 多 


MYO 腕 带 


2014 年 : 

(1) 虚拟 现实 设备 厂商 Oculus 被 互联 网 巨头 Facebook 以 20 
亿美 元 收购 ， 随 后 三 年 索尼 、 人 谷歌 、Facebook 和 HTC 相继 推出 
自己 的 虚拟 现实 设备 PSVR、Daydream、Oculus Rift 和 Vive， 
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特别 一 提 的 是 Oculus 的 手柄 Oculus Touch 能 够 感知 使 用 者 的 手 
上 动作 并 在 游戏 中 实现 手势 操作 。 沉 寂 了 那么 多 年 的 虚拟 现实 终 
于 迎 来 了 爆发 。 

(2) 中 国 公司 柔 宇 科技 发 布 了 全 球 第 一 款 国际 业界 最 薄 、 厚 
度 仅 0.01 毫米 的 全 彩 和 柔性 显示 屏 ， 这 项 新 的 技术 在 未 来 会 对 具有 
屏幕 设备 的 人 机 交互 产生 巨大 影响 。 





和 柔 宇 全 彩 柔 性 显示 屏 


2015 年 ， 日 本 游戏 公司 任天堂 推出 了 现象 级 AR 手 游 
Pokémon GO， 微 软 发 布 了 MR (Mix Reality， 混 合 现实 ) 眼镜 
Hololens，AR 重新 回 到 人 们 视野 。 

2016 年 : 

(1) 360” 全 景 拍 摄 消费 级 相机 开始 涌 入 大 众 的 视野 ， 人 们 又 
多 了 一 种 记录 美好 瞬间 的 方式 。 除 了 以 现 有 的 图 片 、 文 字 和 小 视 
频 进行 交互 外 ， 你 还 可 以 通过 360” 全 景 图 片 和 视频 等 方式 进行 
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沟通 和 表达 ， 更 真实 地 还 原 事件 和 场景 。 这 意味 着 VR 和 AR 数 
据 的 积累 速度 会 不 断 问 升 。 

(2) Google、 索 尼 、Oculus、 三 星 以 及 HTC 等 联合 成 立 了 全 
球 虚拟 现实 协会 (Global Virtual Reality Association，GVRA) ， 
目的 是 统一 未 来 的 VR 行业 规范 ， 为 虚拟 现实 软 硬 件 开发 和 拓展 
打造 一 个 健康 、 公 平 的 行业 环境 。 

2017 年 : 

(1) 日 本 索尼 公司 发 布 了 智能 触 控 投 影 仪 SONY Xperia 
Touch， 它 可 以 在 水 平 或 垂直 的 表面 上 投射 一 个 虚拟 的 屏幕 并 检测 
用 户 的 触 控 手势 命令 。 这 意味 着 任意 载体 都 有 可 能 成 为 计算 机 的 
屏幕 ， 与 物 联网 整合 说 不 定 会 发 生 不 一 样 的 化 学 反应 。 








SONY Xperia Touch 
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(2) 2017 年 成 为 AR 爆发 的 一 年 ， 苹 果 和 Google 相继 推出 
ARKit 和 ARCore，AR 领域 最 神秘 、 最 受 关注 的 创业 公司 Magic 
Leap 发 布 了 消费 级 AR 眼镜 Magic Leap One。 从 现 有 整理 的 资 
料 来 看 ，Magic Leap One 将 会 是 增强 现实 领域 最 重 磅 也 是 最 具 
备 革新 的 产品 之 一 。 深 耕 图 像 识别 多 年 的 Google 发 布 了 人 工 智能 
应 用 Google Lens， 它 能 够 实时 识别 用 智能 手机 相机 所 拍摄 的 物品 
并 提供 与 之 相关 的 内 容 , 这 意味 着 AR 中 最 重要 的 基础 “识别 万 物 ” 
技术 趋 于 成 熟 ， 以 及 基于 现实 空间 的 人 机 交互 技术 趋 于 成 熟 。 









观看 视频 了 解 更 多 入 


生肖 
Magic Leap One 


2018 年 : 
(1) 在 Oculus Connect 5 大 会 上 ，Facebook 的 CEO 马克 。 扎 
克 伯 格 (Mark Zuckerberg) 发 布 了 无 线 VR 独立 一 体 机 Oculus 
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Quest。 这 款 独立 VR 设备 将 是 第 一 款 为 头 显 设备 和 双手 柄 提供 运 
动 位 置 追踪 的 无 线 Oculus 设备 ， 其 采用 新 的 Oculus Insight 技术 
可 以 在 不 放置 任何 传感器 的 情况 下 ， 准 确 获取 用 户 及 其 周围 环境 
的 位 置 。 

(2) 柔 宇 科技 发 布 了 全 球 首 款 可 折 又 柔性 屏 手 机 FlexPai。 用 
户 可 以 通过 自由 折叠 的 方式 ， 将 屏幕 在 4.0 英寸 和 7.8 英寸 自由 切 
换 ， 既 能 方便 携带 ， 又 能 满足 办 公 、 影 音 娱乐 等 场景 下 大 屏 操 作 
的 需求 ， 解 决 了 “怎样 在 满足 大 屏 的 同时 还 能 控制 产品 的 体积 ” 
这 个 问题 。 同 时 ， 由 于 柔性 屏 可 以 在 空间 z 轴 上 发 生变 化 ， 意 味 
着 未 来 屏幕 的 人 机 交互 和 信息 传递 可 以 在 空间 的 z> 轴 上 进行 ， 退 
想 空间 非常 巨大 。 











观看 视频 了 解 更 多 时 
回 


可 折叠 柔 性 屏 手 机 FlexPai 
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可 以 从 以 上 人 机 交互 的 发 展 历程 了 解 到 ， 在 计算 机 发 展 前 中 
期 ， 人 机 交互 的 改变 使 用 户 产生 数据 的 速度 不 断 加 快 ， 这 直接 影 
响 到 人 工 智 能 的 发 展 ， 到 了 2013 年 深度 学 习 算法 在 语音 和 图 像 识 
别 方面 获得 突破 性 进展 后 ， 人 工 智 能 开始 反哺 人 机 交互 的 发 展 ， 
这 说 明 人 工 智能 和 以 人 机 交互 为 代表 的 智能 增强 的 关系 是 密 不 可 
分 的 。 现 在 已 经 很 少 有 人 谈 及 以 往 人 工 智能 和 智能 增强 的 区 别 “ 人 
工 智能 ”这 个 名 词 逐渐 成 为 主流 。 

很 多 专家 学 者 对 第 三 次 人 工 智能 浪潮 给 予 了 肯定 ， 认 为 这 次 
人 工 智 能 浪潮 能 引起 第 四 次 工业 革命 。 人工 智能 逐渐 开始 在 保险 、 
金融 等 领域 渗透 ， 在 未 来 ， 从 健康 医疗 、 交 通 出 行 、 销 售 消费 、 
金融 服务 、 媒 介 娱 乐 、 生 产 制造 ， 到 能 源 、 石 油 、 农 业 、 政 府 等 
所 有 垂直 产业 都 将 因 人 工 智能 技术 的 发 展 而 受益 。 

那么 ， 这 次 人 工 智能 再 次 爆发 的 原因 是 什么 ? 














1.3 ”人 工 智能 再 次 爆发 的 原因 


2000 年 以 来 ， 得 益 于 互联 网 、 社 交 媒 体 、 移 动 设备 和 传感器 
的 普及 ， 全 球 产生 及 存储 的 数据 量 急速 剧 增 。 根 据 IDC 报告 显示 ， 
在 过 去 几 年 ， 全 球 的 数据 量 以 每 年 58% 的 速度 增长 ， 在 未 来 这 个 
速度 将 会 更 快 ，2020 年 全 球 数据 总 量 预 计 将 超过 40ZB 〈 相 当 于 4 
万 亿 GB) ， 这 一 数据 量 是 2011 年 的 22 倍 。 与 之 前 相 比 ， 现 阶段 
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数据 包含 的 信息 量 越 来 越 大 、 维 度 也 越 来 越 多 ， 从 简单 的 文本 、 
图 像 、 声 音 等 富 媒体 数据 ， 逐 渐 过 渡 到 动作 、 姿 态 、 轨 迹 等 人 类 
行为 数据 ， 再 到 地 理 位 置 、 天 气 、 社 会 群体 行为 等 环境 数据 。 这 
些 规 模 更 大 、 类 型 更 丰富 的 数据 直接 提升 了 人 工 智 能 的 算法 模型 
效果 。 

而 在 另 一 方面 ， 运 算 力 的 提升 也 起 到 了 明显 效果 。CPU 虽然 
擅长 处 理 和 控制 复杂 流程 ， 但 不 适合 用 在 计算 量 巨 大 的 机 器 学 习 
上 。 研 究 人 员 为 此 研究 出 擅长 并 行 计算 的 GPU， 以 及 拥有 良好 的 
运行 能 效 比 、 更 适合 深度 学 习 模型 的 FPGA 和 ASIC; Google 的 
TPU、 百 度 的 昆仑 等 AI 芯片 的 出 现 显著 提高 了 数据 的 处 理 速度 ， 
尤其 是 在 处 理 海量 数据 时 明显 优 于 传统 芯片 ， 同 时 芯片 的 功 耗 比 

最 后 ，2006 年 杰 弗 里 。 辛 顿 (Geoffrey Hinton) 提出 的 深度 
学 习 算 法 为 后 续 各 种 人 工 智 能 算法 模型 商定 了 良好 基础 。 同 时 ， 
Google、 微 软 、Facebook 和 百度 等 公司 不 断 将 研究 成 果 转 换 成 简 
单 易学 的 工程 并 开源 给 全 球 开发 者 ， 让 每 位 开发 者 都 能 参与 到 这 
次 AI 浪潮 当中 ， 加 快 整个 人 工 智 能 前 进 的 步伐 。 总 的 来 说 ， 这 次 
人 工 智 能 浪潮 的 涨 起 ， 数 据 、 运 算 力 和 算法 模型 的 爆发 增长 功 不 
可 没 ， 尤 其 是 数据 的 规模 和 丰富 度 ， 它 对 人 工 智能 算法 的 训练 万 
其 重要 。 
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1.4 现在 说 的 人 工 智能 是 什么 ? 


究竟 我 们 现在 讲 的 人 工 智 能 是 什么 ? 在 20 世纪 60 年 代 ，AI 
研究 人 员 认为 人 工 智能 是 一 台 通 用 机 器 人 ， 它 拥有 模仿 智能 的 特 
征 ， 懂 得 使 用 语言 ， 懂 得 形成 抽象 概念 ， 能 够 对 自己 的 行为 进行 
推理 ， 可 以 解决 人 类 现存 问题 。 由 于 理念 、 技 术 和 数据 的 限制 ， 
人 工 智能 在 模式 识别 、 信 息 表示 、 问 题解 决 和 自然 语言 处 理 等 不 
同 领域 发 展 缓慢 。 

20 世纪 80 年 代 ，AI 研究 人 员 转 移 方向 ， 认 为 人 工 智能 对 事物 
的 推理 能 力 比 抽象 能 力 更 重要 ， 机 器 为 了 获得 真正 的 智能 ， 必 须 
具有 身体 ， 它 需要 感知 、 移 动 、 生 存 ， 与 这 个 世界 交互 。 为 了 积 
累 更 多 推理 能 力 ，AI 研究 人 员 开发 出 专家 系统 ， 它 能 够 依据 一 组 
从 专门 知识 中 推演 出 的 逻辑 规则 在 某 一 特定 领域 回答 或 解决 问题 。 

1997 年 ，IBM 的 超级 计算 机 “深蓝 ”在 国际 象棋 领域 完胜 整 
个 人 类 代表 卡 斯 帕 罗 夫 ; 相隔 20 年 ，Google 的 AlphaGo 在 围棋 
领域 完胜 整个 人 类 代表 柯 洁 。 划 时 代 的 事件 使 大 部 分 AI 研究 人 员 
确信 人 工 智 能 的 时 代 已 经 降临 。 

可 能 大 家 觉得 国际 象棋 和 围棋 好 像 没什么 区 别 ， 其 实 两 者 的 
难度 不 在 同一 个 级 别 。 国 际 象棋 走 法 的 可 能 性 虽 多 ， 但 棋盘 的 大 
小 和 每 颗 棋子 的 规则 大 大 限制 了 赢 的 可 能 性 。 深 蓝 可 以 通过 蛮 力 
看 到 所 有 的 可 能 性 ， 而 且 只 需要 一 台 计 算 机 基本 上 就 可 以 搞定 。 
相 比 国际 象棋 ， 围 棋 很 不 一 样 。 围 棋 布局 走 法 的 可 能 性 可 能 要 比 
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宇宙 中 的 原子 数量 还 多 ， 几 十 合计 算 机 的 计算 能 力 都 搞 不 定 ， 所 
以 机 器 下 围棋 想 赢 非常 困难 ， 包 括 围棋 专家 和 人 工 智能 领域 的 专 
家 们 也 纷纷 断言 : 计算 机 要 在 围棋 领域 战胜 人 类 棋 手 ， 还 要 再 等 
100 年 。 结 果 机 器 真 的 做 到 了 ， 并 据说 AlphaGo 拥有 围棋 二 十 段 
的 实力 〈 目 前 围棋 棋 手 最 高 是 9 段 ) 。 

那么 深蓝 和 AlphaGo 在 本 质 上 有 什么 区 别 ? 简单 点 说 ， 深 
蓝 的 代码 是 研究 人 员 编程 的 ， 知 识 和 经 验 也 是 研究 人 员 传 授 的 ， 
所 以 可 以 认为 与 卡 斯 帕 罗 夫 对 战 的 深蓝 的 背后 还 是 人 类 ， 只 不 过 
它 的 运算 能 力 比 人 类 更 强 ， 更 少 失误 。 而 AlphaGo 的 代码 是 自 
我 更 新 的 ， 知 识 和 经 验 是 自我 训练 出 来 的 。 与 深蓝 不 一 样 的 是 ， 
AlphaGo 拥有 两 颗 大 脑 ， 一 颗 负 责 预 测 落 子 的 最 佳 概率 ， 一 颗 做 
整体 的 局 面 判断 ， 通 过 两 颗 大 脑 的 协同 工作 ， 它 能 够 判断 出 未 来 
几 十 步 的 胜率 大 小 。 所 以 与 柯 洁 对 战 的 AlphaGo 背后 ， 是 通过 十 
几 万 次 海量 训练 后 拥有 自主 学 习 能 力 的 人 工 智 能 系统 。 

这 时 候 社会 上 出 现 了 不 同 的 声音 : “人 工 智 能 会 思考 并 解决 
所 有 问题 ”“ 人 工 智能 会 抢 走 人 类 的 大 部 分 工作 ”“ 人 工 智能 会 
取代 人 类 ”…… 已 来 临 的 人 工 智能 究竟 是 什么 ? 

人 工 智能 目前 有 两 个 定义 , 分 别 为 强人 工 智 能 和 弱 人 工 智能 。 

普通 群众 所 遐想 的 人 工 智能 属于 强人 工 智 能 ， 它 属于 通用 型 
机 器 人 ， 也 就 是 20 世纪 60 年 代 AI 研究 人 员 提 出 的 理念 。 它 能 够 
和 人 类 一 样 对 世界 进行 感知 和 交互 ， 通 过 自我 学 习 的 方式 对 所 有 
领域 进行 记忆 、 推 理 和 解决 问题 。 这 样 的 强人 工 智 能 需要 具备 以 
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下 能 力 〈 借 鉴 李 开 复 老师 所 著 的 《人 工 智能 》 一 书 ) : 

(1) 存在 不 确定 因素 时 进行 推理 、 使 用 策略 、 解 决 问题 、 制 
定 决策 的 能 力 。 

(2) 知识 表示 的 能 力 ， 包 括 常识 性 知识 的 表示 能 力 。 

(3) 规划 能 力 。 

(4) 学 习 能 力 。 

(5) 使 用 自然 语言 进行 交流 沟通 的 能 力 。 

(6) 将 上 述 能 力 整 合 起 来 实现 既定 目标 的 能 力 。 

这 些 能 力 在 常人 看 来 都 很 简单 ， 因 为 自己 都 具备 着 ; 但 由 于 
技术 的 限制 ， 计 算 机 很 难 具备 以 上 能 力 ， 这 也 是 为 什么 现 阶 段 人 
工 智能 很 难 达到 常人 思考 的 水 平 。 

由 于 技术 未 成 熟 ， 现 阶段 的 人 工 智能 属于 弱 人 工 智能 ， 还 达 
不 到 大 众 所 垦 想 的 强人 工 智能 。 弱 人 工 智能 也 称 “限制 领 域 人 工 
智能 ”或 “应 用 型 人 工 智能 ”， 指 的 是 专注 于 且 只 能 解决 特定 领 
域 问题 的 人 工 智能 ， 例 如 AlphaGo， 它 自身 的 数学 模型 只 能 解决 
围棋 领域 的 问题 ， 可 以 说 它 是 一 个 非常 狭小 领域 内 的 专家 系统 ， 
而 它 很 难 扩展 到 稍微 宽广 一 些 的 知识 领域 ， 例 如 如 何 通过 一 盘 棋 
表达 出 自己 的 性 格 和 灵魂 。 

弱 人 工 智能 和 强人 工 智 能 在 能 力 上 存在 着 巨大 鸿沟 ， 弱 人 工 
智能 想 要 进一步 发 展 ， 必 须 拥 有 以 下 能 力 〈 借 鉴 李开复 老师 所 著 
的 《人 工 智能 》 一 书 ) : 

(1) 拥有 跨 领 域 推理 能 力 。 
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(2) 拥有 抽象 能 力 。 

(3) “ 知 其 然 ， 也 知 其 所 以 然 ”。 

(4) 拥有 常识 。 

(5) 拥有 审美 能 力 。 

(6) 拥有 自我 意识 和 情感 。 

从 计算 机 领域 来 说 ， 人 工 智能 是 用 来 处 理 不 确定 性 以 及 管 
理 决策 中 的 不 确定 性 ， 即 通过 一 些 不 确定 的 数据 输入 来 进行 一 些 
具有 不 确定 性 的 决策 。 从 目前 的 技术 实现 来 说 ， 人 工 智 能 就 是 深 
度 学 习 ， 它 是 2006 年 由 杰 弗 里 。 辛 顿 《Geoffrey Hinton) 所 提出 
的 机 器 学 习 算法 , 该 算法 可 以 使 程序 拥有 自我 学 习 和 演变 的 能 力 。 

















1.5 机 器 学 习 和 深度 学 习 是 什么 ? 


机 器 学 习 (Machine Learning) 是 一 门 涉及 统计 学 、 神 经 网 络 、 
优化 理论 、 计 算 机 科学 、 脑 科学 等 多 个 领域 的 交叉 学 科 ， 它 主要 
研究 计算 机 如 何 模 拟 或 者 实现 人 类 的 学 习 行 为 ， 以 便 获取 新 的 知 
识 或 技能 。 简 单 点 说 ， 机 器 学 习 就 是 通过 一 个 数学 模型 将 大 量 数 
据 中 有 用 的 数据 和 关系 挖掘 出 来 ， 基 于 数据 的 机 器 学 习 是 当前 人 
工 智 能 的 重要 方法 之 一 。 基 于 学 习 模 式 、 学 习 方 法 以 及 算法 的 不 同 ， 
目前 机 器 学 习 模式 分 为 以 下 四 种 方法 : 

(1) 监督 学 习 ， 它 与 数学 中 的 函数 有 关 ， 也 是 现在 机 器 学 习 
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里 最 常用 的 方法 。 监 督学 习 需要 研究 者 不 断 地 标注 数据 从 而 提高 
模型 的 准确 性 ， 通 过 挖掘 标注 数据 之 间 的 关系 最 后 给 出 结果 。 例 
如 给 一 篮 水 果 中 不 同 的 水 果 都 贴 上 了 颜色 、 形 状 、 名 称 等 标签 ， 
这 时 候 机 器 会 通过 学 习 发 现 红色 、 圆 形 对 应 的 是 苹果 ， 黄 色 、 条 
形 对 应 的 是 香 葵 ， 当 有 一 个 新 水 果 时 ， 机 器 会 根据 学 习 的 结果 知 
道 它 是 苹果 还 是 香 葵 。 监 督学 习 的 典型 应 用 场景 多 为 信息 检索 、 
个 性 化 推荐 、 预 测 、 垃 圾 邮件 侦 测 等 。 

(2) 非 监 督学 习 ， 它 与 现实 中 的 描述 有 关 。 非 监督 学 习 与 需 
要 标签 的 监督 学 习 相 互 对 立 ， 它 可 以 在 没有 提供 额外 信息 的 情况 
下 ， 从 原始 数据 中 自动 提取 出 数据 的 模式 和 结构 ， 从 而 不 断 优化 
自身 模型 最 后 给 出 结果 。 例 如 给 定 一 篮 水 果 ， 要 求 机 器 自动 将 其 
中 的 同类 水 果 归 在 一 起 。 机 器 首先 会 对 篮子 里 的 每 个 水 果 用 多 个 
向 量 来 表示 ， 通 过 不 断 的 自我 学 习 发 现 水 果 有 颜色 、 味 道 和 形状 
三 个 关键 向 量 ， 然 后 机 器 会 将 相似 向 量 的 水 果 归 为 一 类 ， 例 如 红色 、 
甜 的 、 圆 形 的 被 划 在 了 一 类 , 黄色 、 甜 的 、 条 形 的 被 划 在 了 另 一 类 ， 
最 后 会 发 现 第 一 类 的 都 是 苹果 ， 第 二 类 的 都 是 香蕉 。 无 监督 学 习 
的 典型 应 用 场景 多 为 数据 挖掘 、 异 常 检测 、 用 户 聚 类 、 新 闻 聚 类 等 。 

(3) 半 监 督学 习 ， 它 可 以 理解 为 监督 学 习 和 非 监督 学 习 的 结 
合 , 它 仅 需要 少量 的 标注 就 能 完成 识别 工作 。 例 如 给 定 一 篮 水 果 ， 
只 需要 对 少量 水 果 进 行 标注 ， 机 器 就 会 自动 把 所 有 水 果 进 行 分 类 
并 标注 这 类 水 果 是 什么 ， 当 有 一 个 新 水 果 时 ， 机 器 就 会 根据 学 习 
的 结果 判断 它 是 苹果 还 是 香 共 。 
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(4) 强化 学 习 ， 和 前 面 三 种 方法 完全 不 一 样 ， 强 化 学 习 是 一 
个 动态 的 学 习 过 程 ， 而 且 没有 明确 的 学 习 目 标 ， 对 结果 也 没有 精 
确 的 衡量 标准 。 强化 学 习 的 输入 是 历史 的 状态 、 动 作 和 对 应 奖励 ， 
要 求 输出 的 是 当前 状态 下 的 最 佳 动作 。 举 个 例子 ， 假 设 在 午饭 时 
间 你 要 下 楼 吃饭 ， 附 近 的 餐厅 你 已 经 体验 过 一 部 分 ,但 不 是 全 部 ， 
你 可 以 在 已 经 尝试 过 的 餐馆 中 选 一 家 最 好 的 ， 也 可 以 尝试 一 家 新 
的 餐馆 ， 后 者 可 能 让 你 发 现 新 的 更 好 的 餐馆 ， 也 可 能 吃 到 不 满意 
的 一 餐 .而 当 你 已 经 尝试 过 的 餐厅 足够 多 的 时 候 , 你 会 总 结 出 经 验 ， 
例如 “大 众 点 评 ” 上 的 高 分 餐厅 一 般 不 会 太 差 、 公 司 楼 下 近 的 餐 
厅 没 有 远 的 餐厅 好 吃 ， 等 等 ， 这 些 经 验 会 帮助 你 更 好 地 发 现 靠 谱 
的 餐馆 。 许 多 控制 决策 类 的 问题 都 是 强化 学 习 问 题 ， 例 如 让 机 器 
通过 各 种 参数 调整 来 控制 无 人 机 实现 稳定 飞行 ， 通 过 各 种 按键 操 
作 在 计算 机 游戏 中 赢得 分 数 等 。 

深度 学 习 是 机 器 学 习 下 面 的 一 条 分 支 ， 目 前 的 深度 学 习 应 用 
几乎 都 属于 监督 学 习 。 深 度 学 习 能 够 通过 多 层 深度 神经 网 络 对 数 
据 进行 处 理 ， 如 果 发 现 处 理 后 的 数据 符合 要 求 ， 就 把 这 个 网 络 作 
为 目标 模型 ， 如 果 发 现 数据 不 符合 ， 就 不 断 地 自我 调整 神经 网 络 
中 复杂 的 参数 设置 ， 使 自身 模型 进行 不 断 地 自我 优化 ， 从 而 发 现 
更 多 优质 的 数据 以 及 联系 。 目 前 的 AlphaGo 正 是 采用 了 深度 学 习 
算法 击败 了 人 类 世界 冠军 ， 更 重要 的 是 ， 深 度 学 习 促进 了 人 工 智 
能 其 他 领域 如 自然 语言 和 机 器 视觉 的 发 展 。 目 前 人 工 智 能 的 发 展 
依赖 深度 学 习 ， 这 人 句 话 没有 任何 问题 。 
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1.6 人工 智能 的 基础 能 力 


在 了 解 人 工 智能 的 基础 能 力 前 ， 我 们 再 聊 一 下 更 底层 的 东 
西 一 数据 。 计 算 机 数据 分 为 两 种 ， 结 构 化 数据 和 非 结构 化 数据 。 
结构 化 数据 是 指 具 有 预定 义 的 数据 模型 的 数据 ， 它 的 本 质 是 将 所 
有 数据 标签 化 、 结 构 化 ， 后 续 只 要 确定 标签 ， 数 据 就 能 读 取出 来 ， 
这 种 方式 容易 被 计算 机 理解 。 非 结构 化 数据 是 指数 据 结构 不 规则 
或 者 不 完整 ， 没 有 预定 义 的 数据 模型 的 数据 。 非 结构 化 数据 格式 
多 样 化 ， 包 括 了 图 片 、 音 频 、 视 频 、 文 本 、 网 页 等 ， 它 比 结构 化 
数据 更 难 标准 化 和 理解 。 








结构 化 数据 非 结构 化 数据 
:2 Al& 设计 
和 


数据 表 音频 。 ”图片 视频 


结构 化 数据 与 非 结 构 化 数据 
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音频 、 图 片 、 文 本 、 视 频 这 四 种 载体 可 以 承载 着 来 自 世界 万 
物 的 信息 ， 人 类 在 理解 这 些 内 容 时 毫 不 费劲 , 对 于 只 懂 结 构 化 数 
据 的 计算 机 来 说 ， 理 解 这 些 非 结构 化 内 容 比 登 天 还 难 ， 这 也 就 是 
为 什么 人 与 计算 机 交流 时 非常 费劲 。 





Al & 设计 


人 类 与 计算 机 的 理解 差异 


全 世界 有 80% 的 数据 都 是 非 结 构 化 数据 ， 人 工 智 能 想 要 从 
“看 清 ”“ 听 清 ” 达 到 “看 懂 ”“ 上 听 懂 ”的 状态 ， 必 须要 把 非 
结构 化 数据 这 块 硬骨头 哺 下 来 。 学 者 在 深度 学 习 的 帮助 下 在 这 
一 领域 取得 了 突破 性 成 就 ， 为 人 工 智 能 其 他 各 种 能 力 的 发 展商 
定 了 基础 。 

如 果 将 人 工 智能 比 作 一 个 人 ， 那 么 人 工 智 能 应 该 具有 记忆 有 思 
考 能 力 〈 深 度 学 习 、 知 识 图 谱 、 迁 移 学 习 、 自 然 语 言 处 理 ) 、 输 
入 能 力 〈 机 器 视觉 、 语 音 识 别 ) 以 及 输出 能 力 〈 语 音 合成 、 通 过 
信息 载体 传达 信息 ) 。 
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简单 点 说 ， 知 识 图 谱 就 是 一 个 关系 网 络 。 它 从 不 同 来 源 收集 
信息 并 加 以 整理 ,每 个 信息 都 是 一 个 节点 ， 当 信息 之 间 有 关系 时 ， 
相关 节点 会 建立 起 联系 ， 众 多 不 同 种 类 的 信息 节点 逐渐 形成 一 个 
关系 网 络 。 知 识 图 谱 有 助 于 信息 存储 ， 更 重要 的 是 提高 了 信息 的 
查询 速度 和 结果 质量 。 目 前 知识 图 谱 主要 被 用 于 搜索 引擎 、 数 据 
可 视 化 和 精准 营销 等 领域 。 

迁移 学 习 把 已 学 训练 好 的 模型 参数 迁移 到 新 的 模型 来 帮助 新 
模型 训练 数据 集 。 由 于 大 部 分 领域 都 没有 足够 的 数据 量 进行 模型 
训练 ， 迁 移 学 习 可 以 将 大 数据 的 模型 迁移 到 小 数据 上 ， 实 现 个 性 
化 迁移 ， 如 同人 类 思考 时 使 用 的 类 比 推理 。 迁 移 学 习 有 助 于 人 工 
智能 掌握 更 多 知识 。 
自然 语言 处 理 指 用 计算 机 对 自然 语言 的 形 、 音 、 义 等 信息 进 
行 处 理 ， 即 对 字 、 词 、 句 、 篇 章 的 输入 、 输 出 、 识 别 、 分 析 、 理 解 、 
生成 等 的 操作 和 加 工 。 自 然 语言 处 理 主要 研究 人 类 如 何 通过 语言 
与 计算 机 进行 有 效 的 通信 。 计 算 机 想 要 理解 人 类 的 思想 ， 首 先 要 
听 清 楚 人 类 在 说 什么 ， 看 清 人 类 写 的 文字 是 什么 ， 然 后 再 去 理解 
人 类 所 表达 的 意思 是 什么 ， 其 背后 需要 人 工 智能 拥有 广泛 的 知识 
以 及 运用 这 些 知识 的 能 力 ， 以 上 这 些 都 是 自然 语言 处 理 需 要 解决 
的 问题 ， 也 是 计算 机 科学 、 数 学 、 语 言 学 与 人 工 智能 领域 所 共同 
关注 的 重要 问题 。 自 然 语言 处 理 的 主要 范畴 非常 广 ， 包 括 了 语音 
合成 、 语 音 识别 、 语 名 分词 、 词 性 标注 、 语 法 分 析 、 语 句 分 析 、 
机 器 翻译 、 自 动 摘要 、 问 答 系统 等 。 
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机 器 视觉 是 使 用 计算 机 模仿 人 类 视觉 系统 的 学 科 ， 主 要 包括 
了 计算 成 像 学 、 图 像 理 解 、 三 维 视觉 、 动 态 视觉 和 视频 编 解码 
五 大 类 。 机 器 视觉 通过 摄影 机 和 计算 机 代替 人 的 眼睛 对 目标 进 
行 识别 、 跟 踪 和 测量 ， 并 进一步 对 图 像 进行 处 理 。 这 是 一 门 研 
究 如 何 使 机 器 “看 懂 ” 的 技术 ， 是 人 工 智 能 最 重要 的 输入 方式 
之 一 。 如 何 通 过 摄像 头 就 能 做 到 实时 、 准 确 识别 外 界 状况 ， 这 
是 人 工 智能 的 瓶颈 之 一 ， 深 度 学 习 在 这 方面 帮 了 大 忙 。 现 在 热 
门 的 人 脸 识 别 、 无 人 驾驶 、 机 器 人 、 智 能 医疗 等 技术 都 依赖 于 
机 器 视觉 技术 。 

语音 识别 的 目的 是 将 人 类 的 语音 内 容 转 换 为 相应 的 文字 。 
机 器 能 否 与 人 类 自然 交流 的 前 提 是 机 器 能 听 清 人 类 讲 什么 ， 语 音 
识别 也 是 人 工 智能 最 重要 的 输入 方式 之 一 。 由 于 不 同 地 区 有 着 
不 同方 言 和 口音 ， 这 对 于 语音 识别 来 说 都 是 巨大 的 挑战 。 目 前 百 
度 、 科 大 讯 飞 等 公司 的 语音 识别 技术 在 普通 话 上 的 准确 率 已 达到 
97%， 但 方言 准确 率 还 有 待 提 高 。 
目前 大 部 分 的 语音 合成 技术 (Text To Speach，TTS) 是 利用 
在 数据 库 内 的 许多 已 录 好 的 语音 连接 起 来 ， 但 由 于 缺乏 对 上 下 文 
的 理解 以 及 情感 的 表达 ， 朗 读 效果 很 差 。 现 在 百度 和 科大 讯 飞 
等 公司 在 语音 合成 上 有 新 的 成 果 : 2016 年 3 月 百度 语音 合成 了 
张国荣 声音 与 粉丝 互动 ; 2017 年 3 月 本 邦 科技 利用 科大 讯 飞 的 
语音 合成 技术 ， 成 功 帮 助 小 米 手机 实现 了 一 款 内 含 “ 黑 科技 ” 
的 营销 活动 H5。 它 们 的 主要 技术 是 通过 对 张国荣 、 马 东 的 语音 
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资料 进行 语音 识别 ， 提 取 该 人 的 声 纹 和 说 话 特征 ， 再 通过 自然 
语言 处 理 对 讲述 的 内 容 进 行情 绪 识 别 ， 合 成 出 来 的 语音 就 像 本 人 
在 和 你 对 话 。 

Google 旗下 的 Deepmind 在 2016 年 推出 了 语音 生成 模型 
WaveNet ，WaveNet 抛弃 了 以 往 TTS 的 做 法 ， 完 全 通过 深度 神经 
网 络 生成 原始 音频 波形 ， 并 且 大 幅 提高 了 语音 生成 质量 ， 使 语音 
听 起 来 更 自然 。WaveNet 在 2017 年 已 被 用 于 Google Assistant 上 。 
新 的 语音 合成 技术 ， 让 语言 和 情感 的 表达 不 再 被 数据 库 内 的 录音 
所 限制 。 





1.7 人工 智能 的 主要 发 展 方向 


经 过 多 年 的 人 工 智 能 研究 ， 人 工 智能 的 主要 发 展 方向 分 为 计 
算 智能 、 感 知 智能 、 认 知 智能 三 个 阶段 ， 这 一 观点 也 得 到 业界 的 
广泛 认可 。 

计算 智能 是 以 生物 进化 的 观点 认识 和 模拟 智能 。 有 学 者 认 
为 ， 智 能 是 在 生物 的 遗传 、 变 异 、 生 长 以 及 外 部 环境 的 自然 选择 
中 产生 的 。 在 用 进 废 退 、 优 胜 劣 汰 的 过 程 中 ,适应 度 高 的 (头脑 
结构 被 保存 下 来 ， 智 能 水 平 也 随 之 提高 。 机 器 借助 大 自然 规律 的 
启示 设计 出 具有 结构 演化 能 力 和 自 适应 学 习 能 力 的 智能 。 计 算 
智能 算法 主要 包括 神经 计算 、 模 糊 计算 和 进化 计算 三 大 部 分 ， 神 
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经 网 络 和 遗传 算法 的 出 现 ， 使 得 机 器 的 运算 能 力 大 幅度 提升 ， 能 
够 更 高 效 、 快 速 处 理 海量 的 数据 。 计 算 智 能 是 人 工 智 能 的 基础 ， 
AlphaGo 是 计算 智能 的 代表 。 

感知 智能 是 以 视觉 、 听 觉 、 触 觉 等 感知 能 力 辅助 机 器 ， 让 机 
器 能 听 懂 我 们 的 语言 、 看 懂 世 界 万 物 。 相 比 起 人 类 的 感知 能 力 ， 
机 器 可 以 通过 传感器 获取 更 多 信息 , 例如 温度 传感器 、 湿 度 传感器 、 
红外 雷达 、 激 光 雷 达 等 。 感 知 智 能 也 是 人 工 智能 的 基础 ， 机 器 人 、 
自动 驾驶 汽车 是 感知 智能 的 代表 。 

认 知 智能 是 指 机 器 在 计算 智能 和 感知 智能 的 基础 上 ， 拥 有 
主动 思考 和 理解 的 能 力 ， 不 用 人 类 事先 编程 就 可 以 实现 自我 学 
习 ， 有 目的 地 推理 并 与 人 类 自然 交互 。 在 认 知 智能 的 帮助 下 ， 
人 工 智能 通过 洞察 世界 上 当前 和 历史 的 海量 数据 之 间 的 关系 ， 
不 断 挖掘 出 有 用 的 信息 ， 使 自己 的 决策 能 力 提 升 至 专家 水 平 ， 
从 而 更 好 地 辅助 人 类 做 出 决策 。 认 知 智能 将 加 强人 和 人 工 智能 
之 间 的 互动 ， 这 种 互动 是 以 每 个 人 的 偏好 为 基础 的 。 认 知 智 能 
通过 搜集 到 的 数据 ， 例 如 地 理 人 位置、 浏览 历史 、 可 穿戴 设备 数 
据 和 医疗 记录 等 ， 为 不 同 个 体 创造 不 同 的 场景 。 认 知 系统 也 会 
根据 当前 场景 以 及 人 和 机 器 的 关系 ， 采 取 不 同 的 语气 和 情感 进 
行 交 流 。 但 是 机 器 想 做 到 和 人 类 顺畅 地 沟通 目前 是 很 困难 的 ， 
因为 人 类 先 有 语言 ， 才 有 概念 、 推 理 ， 所 以 概念 、 意 识 、 观 念 
等 都 是 人 类 认 知 智能 的 表现 ， 而 机 器 还 停留 在 自然 语言 理解 优 
化 上 ， 机 器 实现 以 上 能 力 还 有 漫长 的 路 需要 探索 。 
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解释 完 人 工 智 能 的 历史 、 基 础 能 力 后 ， 相 信 大 家 对 人 工 智 能 
已 经 有 初步 的 认识 。 前 文 也 通过 智能 增强 以 及 人 机 交互 的 发 展 历 
史 阔 释 了 以 前 的 研究 人 员 是 如 何 看 待人 类 和 人 工 智能 友好 相处 的 。 
那么 ， 人 工 智能 能 否 对 设计 和 用 户 体验 产生 影响 ? 影响 究竟 有 多 
大 ? 请 看 下 一 章 。 
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每 个 时 代 的 设计 都 有 不 同 的 定义 ， 农 业 和 工业 时 代 的 设计 更 
多 是 指 设计 师 通 过 手工 制作 的 方式 阐释 自己 对 美感 和 艺术 的 理解 ; 
信息 时 代 的 设计 除了 要 考虑 美感 ， 还 要 考虑 是 否 实用 和 好 用 。 
计 对 象 开 始 从 真实 世界 转向 数字 世界 ; 设计 思想 开始 考虑 以 用 户 
为 中 心 的 设计 ; 设计 方向 也 增加 了 很 多 领域 ， 包 括 多 媒体 艺术 、 
软件 设计 、 游 戏 设计 、 网 页 设计 、 移 动 应 用 设计 等 ， 设 计 工具 不 
再 只 有 纸 和 笔 ， 各 种 设计 软件 为 设计 师 带 来 更 多 灵感 和 便利 。 


2.1 ”人工 智能 如 何 影 响 设计 


在 人 工 智能 时 代 下 ，AR 设计 、 智 能 硬件 设计 逐渐 发 展 ， 设 计 
的 改革 更 多 考虑 的 是 如 何 将 真实 世界 和 数字 世界 进行 融合 ， 如 何 
在 自己 产品 上 更 好 地 阐释 艺术 、 美 感 和 实用 性 。 可 能 大 家 觉得 人 工 
智能 离 我 们 还 很 遥远 ,但 其 实 我 们 已 经 很 早 就 在 使 用 各 种 AI 技术 ， 
例如 邮件 过 滤 、 个 性 化 推荐 、 语 音 转 变 成 文字 、 苹 果 Siri 和 Google 
Assistant、 百 度 搜索 、 机 器 翻译 等 。 所 以 随 着 AI 技术 的 成 熟 ， 设 计 
必定 会 发 生 新 一 轮 的 变化 。 在 未 来 如 何 做 设计 ? 我 们 可 以 通过 这 几 
年 的 设计 案例 来 推测 在 未 来 AI 技术 对 设计 产生 的 影响 
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2.1.1 深度 学 习 降 低 设 计 门 槛 


相信 大 家 对 Adobe 的 Photoshop、After Effects 并 不 陌生 ， 它 
是 设计 师 手中 的 利器 , 但 由 于 软件 的 学 习 成 本 很 高 , 使 用 并 不 容易 ， 
所 以 有 不 少 设计 新 人 望 而 止 步 。2016 年 ，Adobe 发 布 了 基于 深度 
学 习 的 Adobe Sensei 平台 ， 它 能 够 利用 Adobe 长 期 积累 的 大 量 数 
据 和 内 容 ， 从 图 片 到 影像 帮助 设计 师 解 决 在 媒体 素材 创意 过 程 中 
面临 的 一 系列 问题 ， 将 重复 劳动 变 得 自动 化 。 

Photoshop CC 2018 增加 了 一 键 抠 图 功能 ， 解 决 了 需要 耐心 、 
极度 枯燥 的 抠 图 工作 。 用 户 只 需 两 步 操 作 就 能 将 主体 选取 出 来 : 
第 一 步 按 下 工具 列 上 的 “选择 主体 ”按钮 , 第 二 步 选 中 想 要 的 主体 ， 
Sensei 就 会 主动 分 析 影 像 中 的 主体 与 背景 的 关系 ， 并 且 直 接 将 主 
体 选 取出 来 。 


2 N KC 


A 





Photoshop CC 2018 的 一 键 抠 图 功能 
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在 Adobe MAX 2018 大 会 上 ，Adobe 发 布 了 一 项 名 为 Fontphoria 
的 功能 。 在 演示 中 ， 演 示人 员 只 需要 设计 一 个 字母 ，Fontphoria 
就 能 通过 深度 学 习 技术 把 该 艺术 字体 的 风格 复制 到 其 他 25 个 字母 
上 ， 节 省 了 字体 设计 师 的 大 量 时 间 。 














观看 视频 了 解 更 多 


Fontphoria 功能 展示 


此 外 ， 要 从 一 张 照片 里 取出 某 个 元 素 ， 再 把 它 “ 神 不 知 鬼 不 
觉 ” 地 混入 另 一 张 图 片 里 ， 也 是 一 件 很 有 难度 的 事情 。 正 在 康 奈 
尔 大 学 攻读 博士 学 位 的 栾 福 军 和 同事 共同 研发 了 一 种 名 叫 Deep 
Painterly Harmonization 的 算法 ， 它 通过 局 部 风格 迁移 的 方式 把 各 
种 物体 融合 进 画作 里 ， 而 且 是 真 的 “ 毫 无 PS 痕迹 ”。 大 量 艺术 家 
的 心血 ， 甚 至 艺术 家 自己 ， 都 惨遭 它 的 “毒手 ”。 
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Deep Painterly Harmonization 使 用 案例 


如 果 说 图 片 编辑 工具 Prisma 风靡 了 整个 2016 年 ， 这 里 还 有 
一 个 更 惊艳 的 例子 。FastPhotoStyle 是 英 伟 达 的 图 片 风 格 转换 工具 ， 
其 中 包含 了 将 照片 变 为 各 种 艺术 风格 的 算法 。 只 要 给 出 风格 照片 
和 目标 照片 ， 该 工具 就 能 将 风格 照片 上 的 风格 特点 迁移 至 目标 照 
片上 ， 效 果 简 直 是 以 假 乱 真 。 





FastPhotoStyle 转换 效果 
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2.1.2 ”深度 学 习 减 轻 画 师 的 工作 量 


每 一 部 动画 角色 在 形象 确认 之 前 可 能 需要 画师 画 上 百 张 图 来 
定型 ， 在 制作 二 维 动画 时 每 一 帧 画面 的 变化 也 需要 画师 一 笔 一 笔 
画 出 来 。 每 一 幅 画 的 背后 ， 经 历 了 从 草稿 到 线 稿 再 到 上 色 稿 以 及 
后 期 修正 等 各 个 阶段 ， 这 些 环节 会 耗费 画师 大 量 的 心血 和 精力 。 
有 些 时 候 由 于 档期 的 限制 ， 我 们 会 看 到 动画 由 于 制作 时 间 紧 张 而 
出 现 画 面 崩 坏 的 情况 ， 其 实 不 是 制作 公司 和 画师 不 想 画 好 ， 而 是 
画师 真 的 太 辛苦 了 。 

2016 年 日 本 早 稳 田 大 学 公开 了 一 个 自动 描 线 的 技术 ， 这 项 技 
术 能 够 自动 识别 图 像 并 确定 图 像 的 具体 轮廓 而 完成 描 线 的 工作 ， 
即便 是 衣物 线条 这 类 很 复杂 的 草稿 也 可 以 完美 地 一 口气 地 转化 成 
为 线 稿 。 目 前 这 项 自动 描 线 技术 仅 作 为 早稻田 内 部 的 研究 项 目 ， 
不 过 随 着 技术 的 成 熟 早 晚会 有 一 天 面向 画师 开放 。 








早稻田 大 学 的 自动 描 线 技术 
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对 很 多 没有 绘画 经 验 的 人 来 说 ， 绘 画 是 非常 困难 的 ， 更 困难 
的 是 为 绘画 选择 和 谐 的 色彩 ， 即 使 是 相似 的 颜色 ， 其 中 的 差异 也 
会 对 绘画 结果 产生 巨大 的 影响 。 有 家 名 叫 Preferred Networks 的 日 
本 AI 创业 公司 把 超越 Google 当 作 自己 奋斗 的 目标 。 在 漫画 线 稿 
上 色 AI 这 个 领域 ， 他 们 研发 的 PaintsChainer 几乎 可 以 算是 标杆 。 
PaintsChainer 操作 非常 简单 ， 用 户 选 好 线 稿 上 传 ， 自 行 选择 颜色 
并 涂 在 相应 区 域 ，PaintsChainer 会 根据 图 像 和 提示 的 颜色 实时 自 
动 为 新 图 像 上 色 。 





























PaintsChainer 的 自动 上 色 


Google IO 2018 大 会 上 ，Google Photos 发 布 了 一 系列 的 功能 
改进 ， 包 括 给 黑白 老 照 片 自动 上 色 的 AI 修 图 功能 。 用 户 只 需要 将 
入 白 照片 上 传 到 Google Photos， 就 能 一 键 看 到 上 色 效 果 ， 而 且 效 


酒 | 
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果 非 常 自然 。Google 除了 研发 出 给 黑白 照片 上 色 的 AI 机 器 人 ， 
同时 也 在 研发 一 款 为 黑白 视频 上 色 的 AI 机 器 人 。 研 究 人 员 可 以 从 
彩色 视频 里 截取 某 一 帧 作为 参考 , 然后 把 该 视频 转换 成 黑白 视频 ， 
再 利用 他 们 开发 的 AI 机 器 人 ， 依 靠 参考 帧 的 颜色 ， 将 刚才 的 黑白 
视频 还 原 为 彩色 视频 。 





























Google Photos 为 黑白 老 照 片 自 动 上 色 


日 本 有 位 名 叫 Hiroshiba 的 开发 者 搭建 了 一 个 网 站 Girl Friend 
Factory， 它 能 设置 不 同 的 人 物 属 性 ， 例 如 五 官 、 发 型 、 发 色 、 眼 
睛 的 颜色 、 表 情 甚 至 是 服装 、 装 饰物 , 通过 GAN (生成 式 对 抗 网 络 ) 
生成 不 同 的 二 次 元 头像 。 虽 然 该 技术 还 不 是 很 成 熟 ， 有 些 头像 
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会 有 明显 的 扭曲 ， 但 相信 随 着 技术 的 完善 ， 它 可 以 使 画师 的 绘画 
制作 成 本 进一步 降低 。 


GIr Friend Factory 。 全 成 一 览 。 和 县 省 下 。 其 性 室 更 。 其 性 丘 一 7 合 站 


下 加 直 妆 人 属性 和 通 人 下、 生 威 术 绣 T 玫 于 + 因数 是 || 氮 - 入 > 大志 用 /7 人 < 三 气 = 入 4 梧 搞 1 





手中 色 mn 曲调 要 a 莱 要 当归 > 要 
和 Ei 和 机 过 光 必 要 起 委 
眼色 总 厌 胃 黄 三 en 靳 现 条 喇 村 咀 
铺 咀 次 荐 归 
胺 型 大 口 y9^ 了 OOYIN7 ya-ha7 YAy 子 一 儿 2zx-7A^7 fk 水 = 了 


Girl Friend Factory 自动 生成 二 次 元 头像 


在 区 块 链 领域 ， 有 个 名 叫 Crypko 的 区 块 链 游戏 震撼 了 整个 二 
次 元 圈 ， 其 游戏 玩法 跟 之 前 流行 的 “以 太 猫 ”非常 类 似 : Crypko 
在 前 期 通过 收集 网 络 上 的 不 同 插画 作品 ， 利 用 GAN 神经 网 络 将 两 
张 不 同 风格 的 插画 作品 的 特点 进行 融合 ， 自 动 生成 一 张 新 的 插画 
作品 。 后 期 用 户 可 以 通过 租赁 或 者 购买 的 方式 获取 想 要 的 插画 ， 
再 与 自己 已 有 的 插画 进行 融合 ， 生 成 新 的 插画 。 质 量 好 的 插画 具 
备 较 高 的 收藏 和 观赏 价值 ， 例 如 下 图 中 间 的 插画 租赁 价 为 7 以 太 
币 ，2018 年 10 月 1 以 太 币 约 为 1000 元 人 民 币 。 
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Crypko 插画 


2.1.3 AI 自动 生成 高 质量 逼真 场景 


你 可 能 不 相信 ， 下 面 这 张 高 清 、 逼 真 的 图 像 是 AI 合成 的 。 
CG 要 达到 这 样 真 实 的 效果 ， 需 要 建 模 、 定 材质 、 贴 图 、 上 灯光 和 
泻 染 ， 工 作 量 极 大 。 这 张 逼 真 的 图 像 来 自 香 港 中 文大 学 联合 英 特 
尔 视觉 计算 实验 室 的 最 新 成 果 ， 他 们 共同 研究 出 了 一 种 半 参 数 模 
型 ， 简 称 为 SIMS， 相 关 工 作 论 文 Semi-parametric Jmage Synthesis 
已 被 CVPR 2018 接收 录 。 这 项 技术 主要 思路 是 先 用 大 型 真实 图 像 
数据 集训 练 非 参数 模型 获得 一 个 合成 素材 库 ， 然 后 利用 语义 布局 
分 析 虚 构 场 景 里 有 什么 ， 再 把 这 些 素材 填充 进去 ; 最 后 在 接 颖 的 
地 方 深度 神经 网 络 会 计算 好 不 同 素材 之 间 的 空间 关系 ， 给 予 适 当 
的 光影 关系 ， 合 成 一 幅 逼 真 的 图 片 。 
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Al 合成 的 高 清 、 逼 真 的 图 像 


在 电影 里 ， 虽 然 空间 和 场景 设计 都 不 算是 核心 ， 但 每 一 个 细 
节 都 可 能 影响 整 部 电影 的 质量 ， 同 理 ， 沉 浸 感 很 强 的 VR 也 会 面临 
这 个 问题 。 随 着 AI 泻 染 环境 技术 的 成 熟 ， 高 质量 、 低 成 本 创造 真 
正 模 拟 现实 世界 的 游戏 场景 将 成 为 可 能 。SIMS 的 第 二 作者 陈 启 峰 
已 经 开始 尝试 利用 这 套 算法 来 替换 《侠盗 猎 车 手 5》 里 的 游戏 场景 。 

来 自 英 伟 达 和 MIT 的 研究 团队 ， 在 2018 年 8 月 发 布 了 迄今 
最 强 的 AI 高 清 视频 生成 网 络 一 一 vid2vid。 它 不 仅 能 做 到 自动 合成 
街景 的 效果 ， 而 且 能 通过 一 个 简单 的 素描 草图 ， 生 成 细节 丰富 、 
动作 流畅 的 高 清 人 脸 。 你 只 需要 勾勒 出 人 脸 轮 廓 ， 系 统 就 能 自动 
生成 一 张 张 正在 说 话 的 人 脸 。 你 不 仅 可 以 定制 人 物 的 脸色 和 发 
色 ， 甚 至 可 以 更 换 人 物 身 后 的 背景 。 除 了 自动 合成 与 人 脸 相关 
的 视频 ，vid2vid 还 能 合成 与 人 体 动作 相关 的 视频 。 只 需要 对 下 图 
左 侧 的 人 体 模型 进行 调整 ， 无 论 是 姿势 还 是 身高 、 胖 瘦 ， 右 侧 都 
能 生成 一 个 真人 视频 。 在 未 来 ，AI 除了 能 帮 有 我 们 简化 场景 设计 ， 
还 能 为 我 们 简化 各 种 配角 设计 。 
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观看 视频 了 解 更 多 


vid2vid 自动 生成 动作 的 效果 


2.1.4 平面 照片 转换 成 三 维 立体 头像 


要 将 
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户 带 入 虚拟 世界 ， 需 要 为 每 一 位 
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身份 ， 如 何 为 每 位 用 户 定制 个 性 化 形象 将 成 为 设计 难题 。 视 觉 特 
效 艺术 家 Mahesh Ramasubramanian 和 Kiran Bhat 推出 了 一 款 智 能 
3D 模型 软件 Loom.ai。 通 过 机 器 学 习 和 计算 机 视觉 技术 ， 用 户 只 
需要 上 传 一 张 照片 ，Loom .ai 就 能 对 整个 头 部 进行 建 模 并 识别 照 
片 中 的 面部 细节 (至 于 照片 中 无 法 获得 的 信息 ， 人 工 智能 会 自动 
进行 填充 ) ， 最 后 直接 生成 一 个 高 保 真 的 三 维 立 体 头 像 。 

创始 人 表示 他 们 的 技术 能 做 到 以 下 5 点 : 

(1) 媲美 3D 扫描 的 视觉 保 真 度 。 

(2) 头像 是 可 动 的 ， 像 动画 人 物 一 样 。 

(3) 算法 生成 3A 级 面部 肌肉 ， 自 动 契 合 不 同 脸型 。 

(4) 头像 可 以 通过 嘴巴 、 眼 睛 、 面部 肌肉 的 活动 做 出 各 种 表情 ， 
表现 丰富 的 情感 。 

(5) 去 除 照 片 光线 ， 生 成 的 头像 可 以 融入 各 种 光线 环境 ， 产 
生 不 同 光照 效果 。 








Bt 
观看 视频 了 解 更 多 : 
Loom.ai 效果 图 
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2.1.5 ”让 Al 接手 繁杂 专业 的 图 文 排版 设计 工作 


当今 富 媒体 内 容 越 来 越 多 ， 包 括 了 各 种 内 容 繁 杂 的 图 像 和 文 
字 信息 ， 其 中 图 文 混 排 布局 的 内 容 模式 已 经 成 为 主流 。 在 内 容 创 
作 的 过 程 中 ， 设 计 师 面临 的 巨大 挑战 是 如 何 通 过 内 容 多 样 的 图 像 
和 文字 信息 构建 吸引 眼球 的 版 面 (例如 杂志 封面 、 海报 、 PPT 等 ) 。 
这 个 问题 无 论 对 于 商业 印刷 品 、 在 线 期 刊 、 杂 志 ， 还 是 用 户 生成 
的 内 容 表达 来 说 都 极为 重要 。 图 文 内 容 的 排版 涉及 大 量 的 专业 知 
识 ， 包 括 视觉 传达 、 信 息 艺术 设计 、 色 彩 与 美学 、 平 面 规划 、 几 
何 构图 等 。 以 往 的 图 文 排版 设计 工作 ， 不 仅 需要 具有 丰富 专业 知 
识 的 设计 师 ， 而 且 还 耗费 大 量 的 人 工 。 如 何 让 计算 机 根据 图 文 内 
容 来 自动 进行 排版 是 一 个 非常 困难 的 问题 。 

Flipboard 是 一 款 致力 于 打造 世界 上 最 好 的 个 性 化 杂志 的 应 
用 。2014 年 ，Flipboard 开发 了 一 款 名 叫 Duplo 的 页 面 布 局 引 
擎 ， 它 通过 模块 化 和 网 格 系统 快速 把 内 容 放 入 各 种 尺寸 的 几 千 
种 页 面 中 ， 解 决 不 同 屏幕 尺寸 下 的 图 文 排版 问题 。Duplo 内 置 了 
2000 一 6000 套 布局 模版 。 在 自动 化 排版 过 程 中 ，Duplo 通过 页 面 
流 (Page flow) 、 填 满 现 有 框架 所 需 文字 数量 (Amount of text to 
fill the given frame) 、 随 着 窗口 尺寸 改变 内 容 的 一 致 性 〈Content 
coherence across window resizes) 以 及 图 片 特征 检测 、 宽 高 比 、 拉 仲 、 
裁剪 (Image feature detection，aspect ratio，scale，crop) 等 多 个 


独立 加 权 的 探视 程序 来 计算 内 容 和 模板 的 最 佳 组 合 ; 确认 合适 的 
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布局 后 ，Duplo 会 对 字体 进行 适当 的 调节 ， 并 使 标题 、 正 文 和 图 
片 按照 基准 线 网 格 呈 现 , 最 后 生成 一 个 精致 的 、 考 虑 周全 的 页 面 。 
在 中 国 ， 来 自 微软 亚洲 研究 院 和 清华 大 学 美术 学 院 的 研究 学 
者 开创 了 “视觉 文本 版 面 自动 设计 ”这 一 新 的 研究 方向 。 他 们 把 
设计 学 中 的 审美 原则 与 可 计算 的 图 像 特 征 相 结 合 ， 提 出 了 一 
计算 的 自动 排版 框架 原型 。 该 原型 通过 对 一 系列 关键 问题 进行 优 
化 (包括 嵌入 在 照片 中 的 文字 的 视觉 权重 、 视 觉 空 间 的 配 重 、 心 
理学 中 的 色彩 和 谐 因 子 、 信 息 在 视觉 认 知 和 语义 理解 上 的 重要 性 
等 ) ， 并 把 视觉 呈现 、 文 字 语 义 、 设 计 原 则 、 认 知 理解 等 专业 知 
识 集成 到 原型 内 ， 最 终生 成 的 图 文 排 版 深度 融合 了 多 媒体 与 艺术 
设计 以 及 颜色 心理 学 几 个 不 同学 科 的 知识 。 这 项 研究 将 通用 的 美 
学 感知 进行 了 体系 的 数学 表达 , 用 人 工 智 能 的 方法 进行 艺术 设计 ， 
获得 了 2017 Nicolas D. Georganas 最 佳 论文 奖 。 











BE ST OF 
Rt HE YEAR 

上 交 
和 





视觉 文本 版 面 自 动 设计 案例 
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2.1.6 ”通过 神经 网 络 设计 图 自动 转换 为 代码 


如 何 通过 编程 实现 自己 的 设计 ? 这 应 该 是 很 多 设计 师 的 目标 ， 
但 也 是 很 多 设计 师 的 露 梦 ， 因 为 学 习 编 程 开发 是 一 件 相 对 吃力 的 事 
情 。 相 信 很 多 设计 师 都 有 将 图 片 直接 生成 代码 的 美好 设想 。 哥 本 哈 
根 的 一 家 初创 公司 UIzard Technologies 将 这 美好 设想 变 成 了 可 能 。 
他 们 训练 了 一 个 神经 网 络 ， 项 目 名 为 pix2code， 能 够 把 图 形 用 户 界 
面 效 果 图 转译 成 代码 行 , 成 功 为 开发 者 们 分 担 了 部 分 网 站 设计 流程 。 
令 人 惊叹 的 是 ， 同 一 个 模型 能 跨 平台 工作 ， 包 括 iOS、Android 和 
Web 界面 ， 从 目前 的 研发 水 平 来 看 ， 该 算法 的 准确 率 达到 了 77%。 

比 识别 效果 图 自动 生成 代码 更 疯狂 的 是 ， 一 名 在 Insight 工作 
的 工程 师 Ashwin Kumar， 为 了 简化 整个 设计 工作 流程 、 缩 短 开发 
周期 ， 自 行 开发 了 一 个 名 为 SketchCode 的 卷 积 神经 网 络 ， 它 能 够 
在 几 秒 钟 内 将 手绘 网 站 线 框图 转换 为 可 用 的 HTML 网 站 。2018 年 
8 月 微软 也 开源 了 相似 的 技术 Sketch2Code。 相 信 在 未 来 数 年 内 ， 
深度 学 习 将 改变 前 端 开发 ， 它 将 会 加 快 原型 设计 速度 ， 拉 低 开发 
软件 的 门槛 ， 每 一 位 设计 师 都 有 可 能 独立 建设 自己 的 网 站 。 


Drawn wireframe HT 


ML output 





SketchCode 能 够 将 线 框图 转换 为 HTML 网 站 
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2.1.7 大 数据 驱动 情感 化 设计 


2017 年 ， 一 首 容 纳 了 干 万 伤心 事 、 非 常 特别 的 歌曲 Nor Easy 
冲 上 了 Spotify 全 球 榜 第 2 名 ， 这 首 歌 的 主创 是 格 莱 美 获奖 制作 
人 Alex Da Kid， 最 特别 的 地 方 在 于 它 的 共同 创作 者 还 有 IBM 
Watson。 在 Watson 的 帮助 下 ，Alex 很 快 完成 了 整 首 歌 的 创作 ， 
演绎 出 “ 心 碎 ”这 种 复杂 、 多 态 的 情绪 ， 听 说 很 多 人 在 这 首 短 短 
四 分 钟 的 歌曲 里 听见 了 属于 自己 的 心 碎 时 刻 ， 不 禁 落 泪 。 

在 这 次 合作 的 主题 创作 阶段 ，Watson 的 语义 分 析 API 一 一 
Alchemy Language 对 过 去 5 年 的 文本 、 文 化 和 音乐 数据 进行 
了 分 析 ， 从 中 捕捉 时 代 的 热点 话题 以 及 流行 的 音乐 主题 ， 帮 助 
Alex 锁定 了 这 次 音乐 创作 的 核心 “ 心 碎 ”; 在 歌词 创作 阶 
段 ，Watson 的 情感 洞察 API 一 一 Tone Analyzer 分 析 了 过 去 5 年 
内 26000 首 歌 的 歌词 ， 了 解 每 首 歌曲 背后 的 语言 风格 、 社 交流 行 
趋势 和 情感 表达 ， 同 时 分 析 了 博客 、 推 特等 社交 媒体 上 的 用 户 原 
创 内 容 (User Generated Content，UGC) ， 了 解 受众 对 “ 心 碎 ?” 
这 个 主题 的 想法 和 感受 ， 在 乐曲 创作 阶段 ，Watson Beat 分 析 了 
26000 首 歌 曲 的 节奏 、 音 高 、 乐 嚣 、 流 派 ， 并 建立 关系 模型 帮助 
Alex 发 现 不 同 声音 所 反映 出 的 不 同情 感 ， 探 索 “ 心 碎 ” 的 音乐 表 
达 方 式 ; 在 最 后 的 专辑 封面 设计 阶段 ， 设 计 师 要 如 何 表现 “ 心 
碎 ”? Watson 色彩 分 析 API 一 一 Cognitive Color Design Tool 分 析 
了 海量 专辑 的 封面 设计 ， 启 发 Alex 将 音乐 背后 的 情绪 表达 转化 为 
图 像 和 色彩 ， 完 成 了 专辑 封面 制作 。 
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2.1.8 机 器 学 习 改变 赛车 底盘 设计 


Hack Rod 是 一 家 位 于 洛杉矶 的 初创 公司 ， 他 们 希望 创造 世 
界 上 第 一 辆 用 人 工 智能 构建 并 在 虚拟 现实 环境 中 设计 的 汽车 。 
Hack Rod 团队 制作 了 一 个 具有 几何 结构 的 汽车 底盘 ， 并 将 数 百 
个 传感器 安装 到 汽车 和 司机 身上 ， 在 测试 过 程 中 传感器 捕获 到 
2000 万 个 关于 汽车 结构 和 作用 力 的 数据 点 ， 这 些 数据 可 以 反 
影响 汽车 和 司机 的 物理 量 究竟 是 什么 ， 之 后 传送 到 欧 特 克 的 
Dreamcatcher 重新 生成 新 的 底盘 设计 。 一 旦 最 终 设计 被 选 定 ， 它 
会 被 移交 给 欧 特 克 的 Design Graph。Design Graph 是 一 款 机 器 学 
习 搜 索 应 用 ， 它 会 为 每 一 个 虚拟 零件 提供 建议 使 得 零件 符合 真实 
汽车 制造 标准 。 











机 器 学 习 设计 的 Hack Rod 汽车 底盘 


不 知道 你 有 没有 注意 到 一 个 不 寻常 的 特征 ，Hack Rod 的 底盘 
左右 两 侧 不 是 完全 对 称 的 ， 这 是 有 道理 的 。 在 固定 赛 道中 ， 赛 车 
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会 频繁 地 沿 着 某 个 方向 转圈 ， 因 此 它 的 底盘 两 侧 受 力 有 很 大 不 同 。 
虽然 设计 师 很 早 就 有 这 个 意识 ， 但 是 他 们 一 直 无 法 设计 出 正确 的 
不 对 称 赛车 底盘 。 

在 整个 底盘 设计 过 程 中 , 通过 人 工 智能 构建 、 虚 拟 现实 设计 、 
3D 打印 制造 的 流程 能 极 大 降低 汽车 生产 的 时 间 和 预算 成 本 ，Hack 
Rod 的 创始 人 兼 创意 总 监 Mouse McCoy 接受 采访 时 说 过 : “ 当 你 
开始 加 入 人 工 智能 和 机 器 学 习 时 , 就 像 有 1000 名 工程 师 为 你 工作 ， 
而 所 花 的 时 间 仅 是 曾经 的 一 小 部 分 ， 你 能 以 无 与 伦比 的 速度 来 决 
定 你 的 最 终 产 品 ， 这 就 是 制造 的 普遍 化 。” 





2.1.9 ”社交 信息 预测 时 尚 潮流 


以 时 装 为 代表 的 时 尚 设计 往往 给 人 一 种 激情 、 充 满 艺术 的 感 
觉 ; 而 算法 、 逻 辑 、 程 序 等 技术 往往 给 人 一 种 冰冷 、 理 性 的 感觉 。 
当 服 装 设计 师 遇 上 人 工 智 能 ， 二 者 会 擦 出 什么 样 的 火花 ? 在 澳 大 
利 亚 墨尔本 广 受 认 可 的 时 装 设计 师 Jason Grech 与 IBM Watson 合 
作 ， 着 手打 造 了 2016 年 墨尔本 春季 时 装 周 上 的 首 款 认 知 高 级 时 装 
系列 。Jason 通过 Watson 的 “视觉 识别 ”技术 捕捉 过 去 十 年 的 T 
台 时 尚 图 像 和 实时 的 社交 信息 ， 从 中 汲取 新 的 灵感 并 预测 出 新 的 
潮流 趋势 。 同 时 ， 热 爱 建筑 的 Jason 尝试 将 建筑 图 像 与 时 尚 图 像 
相互 匹配 ， 从 建筑 的 线条 、 曲 线 棱角 和 纹理 中 寻 获 灵感 ， 完 成 了 
最 新 的 高 级 时 装 系列 。 
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The Cognitive Collection 和 


designed by Jason Grech + IBM Watson 





2016 年 墨尔本 春季 时 装 周 认 知 高 级 时 装 系列 


2.1.10 ”Al 提高 建筑 设计 效率 


一 般 来 说 ， 建 筑 设计 主要 包括 以 下 几 个 步骤 : 拿 地 方案 、 概 
念 设计 、 方 案 深化 、 初 步 设 计 和 施工 图 设计 。 其 中 ， 拿 地 方案 、 
概念 设计 只 占 到 整个 项 目的 40%， 但 却 需要 投入 50% 的 精力 。 为 
了 解放 建筑 设计 师 ， 小 库 科技 研发 了 一 套 智 能 设计 平台 ， 可 以 利 
用 机 器 智能 快速 地 帮助 设计 师 完成 拿 地 方案 、 概 念 设 计 等 环节 的 
方案 设计 ， 提 升 整个 设计 前 期 的 效率 。 设 计 师 只 需要 通过 3 步 操 
作 , 小 库 智 能 设计 平台 就 可 以 在 100 秒 钟 内 生成 上 二 个 优质 方案 ， 
同时 智能 地 推荐 9 组 最 能 满足 设计 需求 的 方案 ， 大 幅度 提高 了 建 
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筑 设计 效率 。 同 时 , 设计 师 只 需要 往 小 库 的 智能 审 图 导入 平面 图 ， 
即 可 自动 生成 三 维 方 案 模 型 ， 生 成 的 方案 可 以 达到 99.9% 的 合 规 
率 ， 货 值 ”最 大 化 准确 率 为 95%。 

从 上 述 的 修 图 、 绘 画 、 自 动 排版 、 自 动 生成 场景 和 形象 、 时 
尚 服装 设计 多 个 案例 可 以 看 出 ， 这 几 年 AI 在 效率 、 技 法 和 想法 上 
不 断 影响 着 设计 的 创意 发 散 与 执行 。 同 时 ， 数 字 化 的 创意 不 仅仅 
是 模仿 和 渐进 ， 除 了 能 对 人 类 已 然 做 成 的 事情 进行 延伸 和 组 合 ， 
计算 机 还 能 提出 更 多 的 创意 。 我 们 可 以 乐观 地 认为 ， 当 计算 机 熟 
说 我 们 累积 的 科学 和 工程 知识 ， 并 且 得 悉 具 体 情 况 的 性 能 要 求 ， 
或 者 有 足够 的 数据 来 确定 这 些 要 求 时 ， 它 们 就 能 提出 我 们 根本 想 
不 到 的 新 颖 方案 。 





2.2 人 工 智 能 对 用 户 体验 的 影响 


除了 影响 设计 ， 最 近 两 年 人 工 智能 技术 在 金融 、 安 全 、 交 通 、 
医疗 、 公 共 服 务 和 制造 业 等 领域 逐渐 落地 。 随 着 技术 的 成 熟 ， 人 
工 智能 将 会 在 更 多 领域 影响 人 类 的 生活 和 工作 。 以 人 为 本 的 人 工 
智能 设计 会 变 得 更 加 重要 。 本 节 会 从 安全 性 、 效 率 、 易 用 性 、 场 
景 化 、 个 性 化 五 个 方面 阐述 和 人工 智能 如 何 改善 现 有 的 产品 和 用 户 
体验 ， 这 五 个 方面 存在 着 各 种 联系 并 相互 影响 。 








Q@” 货 值 是 指 以 货币 计算 的 生产 、 销 售 等 经 营 产品 和 货物 的 总 价值 。 
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2.2.1 安全 性 


越 接 近 系 统 底层 的 技术 越 影响 用 户 体验 ， 例 如 手机 中 毒 或 者 
信息 被 盗 都 会 对 用 户 产 生 巨 大 影响 ， 如 果 关 系 到 国家 安全 ， 整 个 
社会 的 秩序 都 会 被 扰乱 。 所 以 安全 性 是 产品 以 及 用 户 体验 的 基础 。 

iPhone X 使 用 了 安全 性 更 高 的 Face ID，Face ID 是 通过 人 脸 
识别 技术 进行 的 生物 特征 认证 。 苹 果 表 示 ，Touch ID 的 指纹 识别 
被 相同 指纹 破解 的 概率 是 五 万 分 之 一 ， 而 Face ID 的 面部 识别 
被 相同 面貌 破解 的 概率 为 一 百 万 分 之 一 ，iPhone 用 户 身份 破解 
的 难度 整整 提升 了 20 倍 。 





苹果 的 Face ID 技术 


人 脸 识别 不 仅 可 以 提高 安全 性 ， 同 时 可 以 提高 用 户 体 验 。 百 
度 钱包 和 友 宝 合作 了 一 款 人 脸 识 别 自动 售 货 机 ， 用 户 购买 商品 时 
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加 | 


以 通过 “ 刷 脸 ”的 形式 进行 支付 , 全 程 不 需要 掏 出 手机 进行 解锁 、 
打开 应 用 、 扫 码 等 烦琐 的 操作 ， 只 需要 在 摄像 头 前 露 个 脸 ， 商 品 
就 会 从 货架 上 自动 掉 下 来 ， 体 验 非常 棒 。 尤 其 是 在 用 户 不 方便 携 
带 手 机 的 健身 房 ， 如 果 放 一 个 人 脸 识别 自动 售 货 机 ， 可 以 大 大 提 
高 健身 房 整体 的 用 户 体验 。 

除了 “ 刷 脸 ”支付 外 ， 百 度 也 将 人 脸 识 别 技术 用 在 安检 上 。 
刷 工 卡 才能 进入 百度 办 公 区 域 已 成 为 过 去 , 员工 还 可 以 通过 “ 刷 脸 ” 
的 形式 自由 进出 办 公 区 域 ， 再 也 不 用 担心 因为 忘记 带 工 卡 而 出 入 
不 便 了 。 

此 外 ， 以 往 人 口 流动 频繁 的 地 方 需要 查验 身份 来 确保 公共 安 
全 ， 查 验 身份 需要 大 量 的 人 力 和 时 间 ， 如 果 遇 上 春运 等 情况 ， 工 
作 人 员 一 时 忙 不 过 来 甚至 可 能 会 导致 乘客 滞留 坐 不 上 回 家 的 火车 。 
最 近海 关 、 高 铁 站 和 机 场 陆续 使 用 了 人 脸 识别 技术 进行 身份 识别 ， 
乘客 只 需要 通过 人 脸 识别 和 刷 指 纹 就 能 完成 安检 。 另 外 ， 英 国 伦 
敦 的 希 罗斯 机 场 和 美国 纽约 的 约翰 。 肯 尼 迪 机 场 正 准备 试用 一 种 
新 的 CT 扫描 仪 ， 可 以 直接 将 行李 箱 里 的 东西 3D 成 像 ， 工 作 人 员 
只 要 对 着 触摸 屏 放 大 或 旋转 图 像 ， 就 可 以 360” 无 死角 地 看 清 你 
包 里 放 的 是 什么 。 经 过 几 百 万 张 图 片 的 图 像 识别 训练 ， 新 的 CT 
扫描 仪 可 以 自动 检测 出 爆炸 物 、 枪 支 或 其 他 禁止 携带 的 物品 。 曾 
经 需要 好 几 分 钟 完成 的 事情 如 今 可 以 在 几 秒 钟 内 完成 ， 极 大 提高 
了 安检 效率 ， 也 使 乘客 等 待 的 时 间 大 幅度 减少 ， 体 验 提 升 。 
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运用 人 脸 识 别 的 安检 系统 


2.2.2 ”效率 


1) 实时 性 

在 以 往 的 重要 直播 上 ， 视 频 会 显示 实时 字幕 ， 这 是 通过 给 原 
有 直播 信号 增加 5 ~ 10 分 钟 的 延 时 ， 速 记 员 在 这 短暂 的 时 间 内 快 
速 整理 并 输出 字幕 , 但 这 需要 消耗 多 名 速记 员 的 大 量 体 力 和 脑力 。 

在 人 工 智 能 时 代 下 ， 计 算 能 力 和 算法 不 断 提升 ， 计 算 机 可 以 
做 到 实时 反馈 结果 。 语 音 识 别 准确 率 高 达 97%， 通 过 语音 识别 和 
自然 语言 处 理 技术 , 每 场 直播 都 能 实现 低 成 本 、 零 延迟 的 实时 字幕 。 
有 些 直 播 还 会 在 视频 旁边 显示 已 有 的 字幕 ， 方 便 用 户 随时 浏览 过 
去 的 内 容 , 对 于 经 常 不 在 座位 旁 但 需要 了 解 直播 内 容 的 用 户 来 说 ， 
这 是 很 棒 的 用 户 体验 。 
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来 是 什么 ? 
Aure ofsearch3 


搜索 的 未 
的 未来 是 什 么 ? 


Swatis the future of AI? 
为 什么 是 皇冠 ? 


,Why will search be the crown 了 


二 什么 地 方 ?从 我 自己 的 一 个 措 述 搜 索 的 未 来 就 是 人 工 智 
过 么 说 时 Hn 人 工 智 能 的 未 来 又 是 什么 ? 





搜狗 CEO 王 小 川 演讲 时 显示 的 实时 字幕 


此 外 ， 如 果 直 播 要 以 多 国语 言 进行 ， 需 要 会 场 上 配置 多 名 同 
传 翻译 ， 成 本 大 幅度 提升 。 相 比 速记 ， 同 传 翻译 更 加 消耗 翻译 人 
员 的 体力 和 脑力 ， 所 以 你 会 发 现 一 场 直播 上 最 少 会 有 两 名 同 传 翻 

译 定期 更 换 。 随 着 直播 时 间 的 增长 ， 越 到 最 后 翻译 质量 越 得 不 到 
保证 ， 这 对 观众 来 说 并 不 是 一 件 好 事 。 而 在 人 工 智能 时 代 下 ， 计 
算 机 不 仅 能 做 到 实时 字幕 ， 同 时 也 能 做 到 实时 翻译 。 实 时 翻译 不 
仅 能 大 幅度 降低 同 传 翻译 的 工作 难度 ， 同 时 也 能 确保 翻译 的 质量 
和 观众 的 观看 体验 。 

而 在 会 场 中 ， 观 众 可 能 会 遇 到 这 样 的 问题 : 拿 同 传 翻译 设备 
需要 抵押 证 件 或 现金 ， 观 众 难免 会 担心 自己 的 证 件 会 被 弄 丢 。 我 
相信 这 个 问题 很 快 能 解决 :不 久 的 将 来 观众 可 以 使 用 自己 的 手机 
和 耳机 充当 同 传 翻译 设备 ， 不 再 需要 抵押 证 件 ， 保 证 自己 在 会 场 
上 的 体验 和 感受 。2017 年 ，Google 推出 了 Pixel Buds 耳机 ， 这 款 
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耳机 能 够 即时 翻译 40 种 语言 ， 跨 语言 沟通 不 再 是 难事 ， 它 也 被 称 
为 《银河 系 漫游 指南 》 中 的 “ 巴 别 鱼 耳塞 ”9?， 同 时 这 项 技术 被 纳 
入 2018 年 麻 省 理工 科技 评论 的 “全 球 十 大 突破 性 技术 ”。 








Google 推出 了 Pixel Buds 耳机 


Google IO 2018 大 会 上 ，Gmail 推出 了 一 项 旨 在 帮助 用 户 以 
前 所 未 有 的 速度 撰写 和 发 送 电子 邮件 的 新 功能 ， 名 叫 智 能 预测 拼 
写 (Smart Compose) ， 该 功能 利用 机 器 学 习 ， 交 互 式 地 为 正在 写 
邮件 的 用 户 提供 补 全 句子 的 预测 建议 ， 从 而 让 用 户 更 快 地 撰写 邮 
件 。 该 功能 使 用 起 来 非常 简单 ， 谷 歌 将 根据 上 下 文 实时 预测 相关 
内 容 , 并 以 灰色 文本 显示 在 光标 后 面 , 用 户 点 击 Tab 键 接受 建议 后 ， 
建议 就 能 直接 补 全 句子 。 此 外 ， 智 能 预测 拼写 功能 仅 需 几 十 毫秒 
的 预测 时 间 ， 用 户 几 乎 感受 不 到 任何 延迟 。 此 外 ， 谷 歌 还 在 研究 

人 语言 模型 ， 以 便 更 准确 地 模拟 每 位 用 户 的 不 同 写 作风 格 。 











中 书 别 鱼 耳 塞 ， 在 《银河 系 漫游 指南 》 中 ， 你 只 要 将 巴 别 鱼 耳 塞 塞 进 耳朵 里 就 能 理解 
任何 语言 。 
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2) 减少 流程 

通过 语音 识别 、 自 然 语 言 处 理 、 知 识 图 谱 等 技术 ， 语 音 操作 
开始 普及 。 语 音 操作 可 以 简化 指令 型 操作 ， 例 如 设置 闹钟 。 以 往 
设置 一 个 手机 闹钟 需要 完成 “解锁 - 寻找 应 用 - 打开 应 用 - 添加 
闹钟 -设置 上 下 午 -设置 小 时 - 设置 分 钟 -设置 是 否 重复 - 保存 - 
退出 闹钟 应 用 ”10 步 操作 ; 现在 通过 说 出 “每 天 早上 6:30 叫 我 
起 床 ” 一 句 话 就 能 把 一 个 闹钟 设置 好 ， 极 大 减少 了 操作 流程 。 对 
于 不 熟练 使 用 手机 的 老年 人 来 说 ， 语 音 操 作 简直 就 是 上 天 赐予 的 
礼物 。 

小 米 MIUI 推 出 了 一 项 名 为 “传送 门 ” 的 功能 ， 用 户 可 以 通 
过 长 按 操作 ,触发 系统 对 长 按 的 内 容 进行 分 析 ， 智 能 匹配 出 百科 、 
商品 、 书 籍 、 地 点 、 翻 译 等 信息 ， 并 即刻 把 相关 的 回馈 信息 传送 
给 用 户 ， 极 大 地 提高 了 跨 应 用 获取 信息 的 效率 。“ 传 送 门 2.0” 还 
增加 了 识别 图 片 的 功能 ， 可 以 识别 出 名 人 、 动 物 、 植 物 、 名 画 、 
电影 海报 等 分 类 ， 用 户 可 以 在 相册 、 微 信 等 应 用 里 对 图 片 进行 图 
像 识 别 ， 获 取 更 多 有 价值 的 信息 。 

去 超市 购物 ， 最 心烦 的 事情 是 什么 ? 可 能 很 多 人 会 回答 : 排 
队 结账 。 的 确 ， 排 队 等 待 确实 很 耗 时 间 ， 谁 不 想 拿 了 就 走 ? 2017 
年 亚马逊 推出 了 颠覆 传统 超市 运营 模式 的 无 人 超市 Amazon Go， 
Amazon Go 使 用 计算 机 视觉 、 深 度 学 习 以 及 传感器 融合 等 技术 自 
动 识别 顾客 的 动作 、 商 品位 置 以 及 商品 状态 ， 顾 客 拿 到 商品 后 无 
须 排队 结账 就 能 直接 离开 商店 ， 离 开 时 顾客 的 智能 手机 会 自动 结 
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算 并 收 到 相关 账单 。Amazon Go 减 去 了 顾客 在 超市 里 的 排队 结账 
流程 ， 使 得 顾客 拥有 更 好 的 购物 体验 。 

















| 
Clu Tele) Ye 
Ye 


Now open in Seai 





无 人 超市 Amazon Go 


深圳 市 宝安 国际 机 场 携手 微 信 支付 正式 推出 “ 微 信 无 感 支 付 ” 
停车 场 ， 基 于 “ 微 信 和 车主 服务 ”和 停车 场 的 车 牌 识别 系统 两 方面 
能 力 的 结合 ， 将 车 辆 进出 停车 场 的 时 间 缩 短 了 80%， 实 现 了 入 场 
无 须 领 卡 、 离 场 无 须 扫 码 的 体验 。 在 高 速 收费 站 场景 里 ， 微 信 、 
支付 宝 也 启动 了 高 速 收费 站 无 感 支 付 。 无 感 支付 为 用 户 带 来 了 通 
行 体验 的 升级 ， 同 时 节省 了 用 户 大 量 的 等 待 时间 。 





2.2.3 ” 易 用 性 


1) 降低 复杂 度 
除了 前 文 提 到 的 一 键 抠 图 功能 ，Adobe 发 布 的 Adobe Sensei 
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平台 还 能 够 让 After Effects 支持 视频 内 的 人 脸 识 别 和 物体 识别 ， 
设计 师 可 以 直接 为 演员 戴 面具 或 者 增加 其 他 特效 ， 以 及 为 演员 的 
衣服 替换 颜色 。Adobe Sensei 使 设计 工具 的 学 习 门槛 和 制作 成 本 
大 幅度 降低 ， 设 计 师 能 有 更 多 的 时 间 去 思考 和 表达 创意 。 

视 障 人 士 使 用 手机 是 一 件 非常 麻烦 的 事情 ， 因 此 Android 和 
iOS 提供 了 相应 的 屏幕 阅读 服务 TalkBack 和 VoiceOver， 让 视 障 
人 士 可 以 “听见 ”网 站 或 App 里 的 内 容 。 但 问题 来 了 ， 目 前 应 用 
市 场 上 的 大 部 分 应 用 与 读 屏 软件 不 太 兼 容 ， 视 障 人 士 使 用 时 体验 
不 佳 。 调 查 发 现 ， 因 为 视 障 人 士 出 门 购物 十 分 不 便 ， 他 们 最 大 的 
渴望 就 是 像 普 通 人 一 样 在 电 商 世界 里 顺畅 地 浏览 、 愉 快 地 闲逛 以 
及 寻找 最 优 价 格 。 而 电 商 购物 网 站 中 ， 促 销 信息 、 宝 贝 介绍 通过 
图 片 来 展示 已 成 为 一 种 普遍 现象 ， 这 对 于 使 用 读 屏 软件 的 视 障 人 
士 而 言 ， 则 是 一 个 “灾难 ”。 以 下 是 他 们 在 应 用 里 的 体验 和 感受 。 


我 们 眼中 是 这 样 的 视 障 者 耳 中 是 这 样 的 


品 4 商品 介绍 规格 参数 包装 售后 


商品 介绍 规格 参数 包装 售后 
©@ @ @ ?323 及 朋 多 ?2373 


aptX 技 术 认证 HiFi 发 烧 级 音质 镀 钛 耳膜 


@ @ ©@ TET 2 YUE 


10 小 时 超 长 使 用 升级 防 脱 耳 必 。 “纳米 级 防水 防 汗 
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锤子 科技 为 了 解决 这 个 问题 ， 创 造 性 地 将 OCR 技术 与 系统 的 
售 息 无 障碍 优化 进行 结合 ， 视 障 人 士 可 以 通过 系统 级 别 的 文字 识 
别 功能 ， 来 获取 屏幕 上 的 按钮 或 者 图 片 中 的 文字 信息 ， 以 及 获取 
购物 网 站 上 的 促销 信息 。 锤 子 推出 的 “无 障碍 模式 ”降低 了 各 类 
应 用 程序 对 视 障 人 士 造成 的 信息 阻碍 。 

同时 ，Smartisan OS 4.1 集成 了 可 大 幅 降低 用 户 操作 步骤 的 批 
处 理 命 令 功能 。 通 过 简单 的 语音 命令 ， 即 可 完成 复杂 步骤 的 命令 
操作 ， 大 幅 提升 操作 效率 。 如 说 出 语音 命令 “ 微 信 付 款 码 ”， 即 
可 直接 打开 微 信 付款 码 界 面 ， 节 省 了 多 个 步骤 的 操作 。 视 障 用 户 
在 各 种 电 商 大 促 也 可 以 更 加 顺畅 地 购物 了 。 

2) 准确 性 

Google 是 最 早 提出 并 使 用 知识 图 谱 的 搜索 引擎 。 通 过 构建 知 
识 图 谱 的 方式 ，Google 为 人 物 、 书 籍 、 电 影 等 现实 事物 建立 关联 ， 
并 将 搜索 结果 进行 知识 系统 化 。 任 何 一 个 关键 词 都 能 获得 完整 的 
知识 体系 ， 例 如 搜索 Amazon， 一 般 的 搜索 结果 会 显示 Amazon 购 
物 网 站 ， 但 Amazon 并 不 仅仅 是 一 个 网 站 ， 它 还 是 全 球 流量 最 大 
的 Amazon 河流 ，Google 期 待 能 够 将 所 有 的 结果 通过 “知识 图 谱 ” 
模块 展示 出 来 .通过 知识 图 谱 技术 , 用 户 将 会 获得 更 佳 的 搜索 体验 ， 
并 且 能 够 更 快 、 更 简单 、 更 准确 地 发 现 新 的 信息 和 知识 。 
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Google comgeenaA i 


谷歌 < Googe 


人 
开间 人 RS 3 







于 开关。Googie 下 在 和 和 诺 大 以 讲 租 上 舍 
相生 Ce 
pp 天 市 林 共 同 争 建 ， 国人 也 站 术 Bop, MN 
创 品 人 ; 拉 寻 仙 奇 ， 谱 尔 藻 - 布 林涛 右 
Me 拉 里 - 候 再 ora 列表 基 千 尔 声 联 创立 于 1998 年 9 月 4 日， 加 利 视 尼 豆 州 门 滞 的 克 
总 避 ; 析 利 福 尼 亚 州 攻 迁 给 万 
拉 里 . 候 厅 - 维基 百科 理据 行 号 多 久 介 .友基 (2015 年 10 月 2 日-) 


hepe-lzh wicpedia orgyzr-hans/ 拉 里 -个 从 

当 商 位 人 失信 于 2001 年 王 玫 志 昌 页 入 玫 特 为 Googe 闭 事 长 、 首 民 拓 行 官 后 ， 信 条 给 去 了 其 避 才 职务 ， 现 
在 这 三 染 马 世 一 直 扒 动 着 Goog 的 直 展 。 按照 逢 市 斯 放 计 ， 近 时 抽 厅 大 要 有 203 亿 美元 的 财产 ， 全 他 成 
为 类 国 秀 13 识 有 的 人 以 及 世界 上 洲 20 训 有 的 人 ， 愧 惠 涉 关 个 时区 买 一 打下 计 15 为 从 们 私人 使 用 。 
20144F4 月 4 日 ， 拉 于 伺机 


子 公司 YouTube，NestLabs， 甘 多 日 本 ，AdMob， DoubloClek, 
更 多 
Sia: Aphacet 


用 户 还 搜索 了 还 有 15+ 硕 


Google 的 知识 图 谱 


3) 实时 教程 

AR 技术 将 会 让 产品 说 明 失 去 存在 的 价值 。 纸 质 说 明 书 通常 需 
要 用 户 去 读 取 文 字 信息 和 图 片 注 解 ， 而 AR 技术 可 以 识别 对 象 ， 
并 在 此 基础 上 县 加 文本 或 视频 说 明 。AR 眼镜 将 协助 用 户 实现 
最 好 的 体验 ， 用 户 可 以 解放 双手 ， 在 操作 的 同时 ， 实 时 查看 说 
明 人 信息。 其实 AR 使 用 手册 在 1992 年 已 经 开始 投入 使 用 ， 波 音 
公司 开发 的 头 戴 式 显示 系统 就 能 帮助 工程 师 组 装 电路 板 上 的 复 
杂 电 线束 。 
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AR 使 用 手册 


2.2.4 场景 化 


场景 包括 用 户 背景 、 用 户 情感 、 时 间 、 空 间 信息 、 与 上 下 文 
相关 的 背景 知识 ， 如 何 通过 人 工 智 能 技术 实现 场景 化 是 人 工 智能 
最 能 体现 价值 也 是 最 难 攻克 的 重要 部 分 。 目 前 的 人 工 智 能 产品 只 
能 通过 人 为 设计 去 解决 比较 简单 的 场景 问题 ， 还 没 达 到 真正 的 智 
能 阶段 。 个 人 认为 ， 知 识 图 谱 是 人 工 智能 解决 场景 化 的 重要 手段 
之 一 ,通过 知识 图 谱 去 构建 用 户 的 历史 背景 , 了 解 用 户 与 周围 事物 、 
产品 之 间 的 交互 和 关系 ， 有 助 于 人 工 智 能 系统 找到 最 佳 的 答案 反 
馈 给 用 户 。 


Google IO 2018 大 会 上 ，Google 发 布 了 Google Duplex 人 工 
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智能 语音 技术 ， 它 可 以 通过 打 电 话 给 人 类 并 用 自然 的 对 话 完成 一 
系列 真实 世界 的 任务 ; 同时，Duplex 采用 了 Deepmind 的 Wavenet 
技术 , 使 机 器 的 声音 与 真人 基本 无 异 。 在 现场 , 谷歌 CEO 桑 达尔 " 皮 
查 全 (Sundar Pichai) 让 Google Duplex 给 美发 店 现场 打 电 话 预约 
理发 时 间 ， 店 员 完 全 没有 发 现 跟 她 聊天 的 是 一 个 机 器 人 。 以 下 是 
Google Duplex 和 美发 店 店员 的 沟通 记录 : 

店员 : 您 好 。 

Duplex: 您 好 ， 我 想 帮 有 我 的 客户 预约 一 个 理发 时 间 ， 请 问 
月 3 号 可 以 吗 ? 

店员 : 好 的 ， 请 稍 等 一 下 。 

Duplex: 嗯 哼 。 (引起 了 发 布 会 现场 的 大 笑 。) 

店员 : 好 的 ， 您 想 约 几 点 呢 ? 

Duplex: 中 午 12 点 。 

店员 : 12 点 不 行 ， 最 接近 的 是 下 午 1 点 15 分 。 

Duplex: 上 午 10 点 到 12 点 之 间 可 以 吗 ? 

店员 : 那 要 看 具体 做 什么 了 ， 您 知道 她 要 什么 服务 吗 ? 

Duplex: 就 简单 的 洗 剪 吹 

店员 : 那 10 点 可 以 。 

Duplex: 好 ， 那 就 10 点 。 

店员 : 好 ， 她 叫 什么 名 字 呢 ? 

Duplex: 她 叫 丽 莎 。 

店员 : 好 的 ， 那 我 们 5 月 3 日 10 点 见 





089 


| Al 改变 设计 | 人 工 智能 时 代 的 设计 师 生存 手册 


Duplex: 太 好 了 ， 谢 谢 。 

从 以 上 对 话 的 内 容 可 以 看 出 ，Duplex 在 熟悉 用 户 基本 信息 和 
行程 安排 的 情况 下 能 够 和 美发 店 店员 进行 交流 ， 并 根据 上 下 文 的 
理解 给 出 不 同 的 反馈 。 尽 管 目前 人 工 智 能 还 做 不 到 对 全 部 场景 进 
行 理 解 、 掌 握 一 般 对 话 的 能 力 ， 但 是 它 已 经 能 为 用 户 完成 一 些 特 
定 的 任务 ， 帮 助 用 户 解 决 更 多 的 个 性 化 需求 。 在 未 来 它 就 跟 贴身 
助理 一 样 ， 会 成 为 你 生活 的 一 部 分 。 


2.2.5 个 性 化 


所 谓 干 人 干 面 ， 每 个 人 都 有 自己 个 性 的 一 面 ， 如 何 满足 每 一 
位 用 户 的 个 性 化 需求 是 每 个 产品 最 想 也 是 最 难 实现 的 功能 。 拌 
音 就 是 移动 互联 网 中 最 成 功 也 是 最 “有 毒 ” 的 产品 ， 它 通过 个 
性 化 推荐 技术 满足 了 用 户 的 好 奇 ， 使 用 图 像 识 别 和 AR 技术 降 
低 了 用 户 制 作 视频 的 门槛 ， 让 用 户 低 成 本 制作 符合 自己 个 性 的 
视频 ， 最 后 通过 精准 的 用 户 定 位 和 运营 策略 获得 了 用 户 的 火箭 
式 增 长 。 

手机 百度 的 标语 是 “手机 百度 看 资讯 ， 千 人 干 面 大 不 同 ”。 
其 借助 百度 强大 的 自然 语言 处 理 、 知 识 图 谱 和 深度 学 习 等 技术 ， 
为 6 亿 用 户 标记 上 百 万 个 标签 ， 并 且 能 够 根据 不 同 用 户 的 使 用 行 
为 、 场 景 、 个 人 兴趣 等 标签 推荐 给 每 一 个 用 户 不 同 的 资讯 内 容 ， 
用 户 能 更 便捷 地 获取 信息 。 
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在 英国 ， 每 周末 约 有 150 万 人 进入 各 地 的 体育 馆 ， 体 验 现场 
体育 赛事 的 快感 。 由 于 球赛 瞬息 万 变 ， 球 迷 在 现场 很 难 用 自己 的 
手机 捕捉 到 激动 人 心 的 时 刻 。 英 国有 家 名 叫 Snaptivity 的 科技 公 
司 注意 到 了 这 一 点 ， 它 希望 能 帮助 球迷 捕捉 到 球迷 想 要 的 瞬间 。 
Snaptivity 把 自动 摄像 机 以 及 物 联 网 传 感 网 络 遍布 了 整个 体育 场 ， 
这 些 设备 只 需 不 到 十 秒 即 可 完成 整个 体育 场 的 扫描 ， 并 且 能 够 准 
确定 位 每 一 位 球迷 的 座位 ， 同 时 Snaptivity 研发 的 AI 人 群 追踪 技 
术 能 预测 下 一 个 重要 时 刻 将 在 何 时 何 地 降临 ， 摄 像 机 会 把 球迷 充 
满 绝望 、 赢 得 胜利 等 时 刻 都 抓 住 。 球 迷 只 需要 在 Snaptivity 的 App 
上 输入 自己 的 座位 号 ， 属 于 你 的 难忘 时 刻 就 会 直接 发 送 至 你 的 手 
机 ， 使 用 Snaptivity 拍摄 的 照片 分 享 率 和 点 赞 率 提高 了 3 倍 以 上 ， 
这 家 为 球迷 带 来 前 所 未 有 体验 的 Snaptivity 公司 也 获得 了 2018 年 
夏 纳 创意 节 移动 类 金奖 。 








2.3 ”结语 


现在 PC 和 移动 设备 的 用 户 界 面 更 多 是 获取 信息 的 入 口 ， 越 
简单 越 扁平 的 设计 ， 越 有 助 于 用 户 高 效 便捷 地 获取 信息 ， 这 也 是 
为 什么 几 年 前 拟 物 化 设计 逐渐 被 扁平 化 设计 取代 的 原因 。 随 着 Ai 
技术 的 成 熟 , 更 多 领域 将 实现 电子 化 和 信息 化 , 通过 数字 挛 生 技术 ， 
计算 机 用 户 界 面 除 了 获取 信息 , 还 会 承担 更 多 的 角色 , 例如 在 农业 、 





= 一 一 91 


| Al 改变 设计 | 人 工 智能 时 代 的 设计 师 生存 手册 





工业 、 服 务 业 等 领域 成 为 新 的 劳动 力 。 电 子 世界 将 会 一 步 步 地 与 
真实 世界 进行 融合 ， 人 类 和 机 器 的 关系 将 越 来 越 密 切 。 

在 这 样 的 趋势 下 ， 数 字 扁 平 化 设计 不 一 定 是 最 好 的 设计 〈 因 
为 它 更 多 的 是 二 维 界面 的 产物 ) ， 数 字 三 维 空间 设计 将 重新 回 到 
大 众 的 视野 ， 人 机 交互 也 将 从 计算 机 二 维 界 面 拓 展 到 真实 世界 ， 
人 类 和 机 器 如 何 更 好 地 互动 与 合作 ， 将 是 人 机 交互 的 一 大 挑战 。 
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3.1 哪些 设计 容易 被 人 工 智能 取代 


第 2 章 从 多 个 方面 讲述 了 人 工 智 能 对 设计 的 帮助 和 影响 ， 这 
也 意味 着 人 工 智 能 会 向 设计 师 发 出 更 多 的 挑战 。 那 么 ， 什 么 样 的 
设计 容易 被 人 工 智能 取代 ? 我 总 结 了 三 个 方面 : 〈1) 通过 训练 就 
能 掌握 的 设计 技法 ，〈2) 由 数据 支撑 、 可 模块 化 的 设计 ， (3) 更 
自然 的 交互 。 





3.1.1 通过 训练 就 能 掌握 的 设计 技法 


现在 熟悉 并 掌握 PS、AE 等 复杂 设计 工具 的 门槛 越 来 越 低 。 
Adobe 深度 学 习 平 台 Sensei 将 AI 技术 用 在 自家 产品 上 ， 抠 图 、 更 
换 光 源 等 曾经 需要 慢 慢 雕 琢 才 能 达到 “ 毫 无 PS 痕迹 ”的 操作 都 能 
一 键 解决 , 极 大 地 降低 了 这 些 工具 的 学 习 门 覆 和 设计 师 的 时 间 成 本 。 

此 外 ， 图 片 处 理应 用 Prisma 通过 深度 学 习 将 一 张 图 片 的 风格 
特征 分 析出 来 ， 例 如 上 色 技 法 、 笔 触 技 法 、 干 湿 画 法 等 ， 然 后 毫 
无 保留 地 将 其 迁移 至 另外 一 张 图 片 。 因 此 ， 通 过 长 时 间 就 能 完成 
的 临摹 工作 也 会 被 人 工 智能 取代 。 
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现在 各 行业 的 设计 需求 越 来 越 多 ， 与 此 同时 设计 师 的 人 力 成 
本 居 高 不 下 ， 如 何 满足 各 行业 的 设计 需求 成 为 一 个 难题 。 阿 里 在 
2017 年 “ 双 11” 期 间 为 商家 制作 了 4 亿 张 海报 ， 背 后 的 功臣 是 名 
叫 “ 鹿 班 ”的 AI 设计 应 用 。 鹿 班 的 原理 是 阿里 设计 师 将 自身 的 经 
验 知识 总 结 出 一 些 设计 手法 和 风格 ， 再 将 这 些 手法 归纳 成 一 套 设 
计 框 架 , 让 机 器 通过 自我 学 习 和 调整 框架 , 演绎 出 更 多 的 设计 风格 。 
创始 人 乐 乘 预计 在 2018 年 的 “ 双 11” 鹿 班 可 以 达到 市 面 上 的 高 
级 设计 师 水 平 。 除 了 鹿 班 ， 阿 里 还 开发 了 一 个 短视 频 生 成 机 器 人 
Allwood， 它 通过 整合 图 文 内 容 的 方式 自动 生成 20 秒 带 有 配乐 的 
短视 频 ， 帮 助 商 家 降低 制作 视频 的 成 本 。 鹿 班 和 Allwood 将 满足 
大 部 分 业务 的 运营 需求 ， 不 需要 太 多 独创 性 的 纯 体力 活 将 会 被 人 
工 智能 取代 。 

总 的 来 说 ， 在 人 工 智 能 时 代 ， 可 被 程式 化 的 重复 性 工作 、 仪 
靠 记 忆 与 练习 就 可 以 掌握 的 技能 将 是 最 没有 价值 的 ， 几 乎 可 以 由 
机 器 来 完成 。 


3.1.2 ”由 数据 支撑 、 可 模块 化 的 设计 


现在 很 多 产品 的 功能 已 经 被 模块 化 ， 在 项 目 里 设计 师 会 总 结 
出 一 套 完整 的 设计 规范 ， 后 续 设 计 师 只 需要 根据 需求 使 用 不 同 的 
模块 以 及 对 应 的 设计 规范 来 组 装 产品 即 可 。Airbnb 研发 了 一 个 名 
叫 Sketch2code 的 机 器 学 习 工 具 ， 它 能 直接 将 设计 师 的 手绘 原型 
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转换 成 UI 设计 稿 和 对 应 的 代码 ， 加 快 了 整个 开发 周期 。 如 果 用 户 
需求 能 被 模型 化 ， 人 工 智能 也 能 自主 完成 相应 的 产品 设计 。 

那么 用 户 需求 是 否 能 被 模型 化 ? 部 分 用 户 需 求 可 以 被 模型 化 。 
这 里 我 们 需要 回顾 一 下 用 户 体验 设计 流程 是 怎样 的 : 首先 用 户 研 
究 人 员 根 据 大 规模 人 群 的 使 用 数据 总 结 出 用 户 的 行为 ， 并 将 通用 
的 规律 交 由 设计 师 进行 处 理 ， 设 计 师 根据 结论 优化 对 应 的 流程 和 
组 件 设计 。 如 果 说 产品 的 优化 依赖 于 用 户 数据 ， 而 用 户 数据 更 多 
是 计算 机 的 产物 ， 那 么 在 数据 分 析 上 计算 机 有 可 能 比 人 类 做 得 更 
好 ， 因 为 人 类 的 学 识 、 能 力 和 精力 都 是 有 限 的 。 在 海量 数据 面前 ， 
由 于 各 种 主观 因素 导致 用 户 研究 人 员 有 可 能 会 忽略 一 些 细 节 ， 很 
难 站 在 全 局 看 待 所 有 的 数据 ; 但 是 计算 机 的 精力 是 无 限 的 ， 当 技 
术 成 熟 ， 在 数据 分 析 上 计算 机 会 略 胜 一 筹 。 

心理 学 也 是 研究 用 户 需求 的 学 科 之 一 。 最 近 ，DeepMind 开 了 
一 个 心理 学 实验 室 Psychlab， 它 能 够 实现 传统 实验 室 中 的 经 典 心 
理学 实验 ， 让 这 些 本 来 用 来 研究 人 类 心理 的 实验 ， 也 可 以 用 在 AI 
智能 体 上 。 当 后 续 心理 学 可 以 被 量化 时 ， 计 算 机 能 将 心理 学 变 成 
模型 ， 那 么 计算 机 就 能 更 完整 地 分 析出 用 户 想 要 什么 。 

总 的 来 说 ， 由 于 各 种 限制 ， 设 计 师 无 法 做 到 为 每 名 用 户 量 身 
定制 不 同 的 个 性 化 功能 ， 但 是 人 工 智 能 可 以 做 到 。 人 工 智 能 根据 
不 同 用 户 的 历史 数据 和 需求 为 每 一 位 用 户 改变 功能 ， 实 现 “ 千 人 
千 面 ”。 
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3.1.3 ”更 自然 的 交互 


自然 语言 处 理 的 成 熟 使 语音 交互 能 力 逐 渐 成 熟 ， 计 算 机 视觉 
的 成 熟 使 计算 机 能 够 容易 地 识别 人 类 的 肢体 语言 ， 人 类 可 以 用 更 
自然 的 方式 和 计算 机 进行 交互 ， 自 然而 然 不 需要 这 么 多 设计 师 来 
设计 界面 了 。 

以 上 的 案例 也 说 明了 一 点 ， 人 工 智 能 即使 不 懂 审 美 ， 也 可 以 
替代 人 类 生产 可 被 公式 化 〈 规 范 化 ) 的 设计 。 可 被 公式 化 的 设计 
说 明 这 些 设计 是 已 成 熟 的 、 有 规律 的 (可 以 建立 模型 ) 、 受 限制 
的 (具有 参数 ) 、 可 量 产 的 。 总 的 来 说 ， 人 工 智 能 的 成 熟 对 于 大 
部 分 设计 师 来 说 简直 是 灾难 性 的 打击 ， 之 前 无 论 是 通过 技法 还 是 
数据 分 析 才 能 完成 的 工作 ， 人 工 智能 一 下 子 就 可 以 完成 ， 后 续 根 
本 不 需要 这 么 多 设计 师 来 完成 这 些 工 作 。 那 么 设计 师 是 否 会 被 人 
工 智能 取代 ? 








3.2 ”设计 师 与 人 工 智能 
3.2.1 人 类 与 人 工 智 能 


设计 是 为 了 解决 问题 。 从 定义 上 来 讲 ， 人 工 智 能 能 够 使 机 器 
代替 人 类 实现 认 知 、 识 别 、 分 析 、 决 策 等 功能 ， 其 本 质 是 为 了 让 
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机 器 帮助 人 类 解决 问题 。 也 就 是 说 ， 人 工 智 能 在 一 定 程 度 上 也 是 
一 种 设计 ， 它 会 创作 出 与 人 类 思维 模式 类 似 甚 至 超越 人 类 思维 模 
式 的 解决 方案 。 

当 人 与 机 器 一 起 竞赛 解决 问题 时 ， 问 题 的 复杂 程度 会 直接 影 
响 解 题 人 的 最 终 方案 ， 因 为 人 的 知识 、 经 验 、 精 力 是 有 限 的 ， 很 
少 甚至 没有 人 会 长 时 间 都 在 解决 同一 个 问题 。 当 解 题 人 找 不 到 最 
优 方案 时 ， 他 们 给 出 的 方案 往往 具有 一 定 的 主观 性 ， 甚 至 有 可 能 
是 错误 的 。 但 比 起 人 类 ， 计 算 机 拥有 四 个 优势 : 

(1) 可 以 在 极 短 时 间 内 完成 超 复杂 的 运算 ; 

(2) 可 以 长 时 间 不 大 其 烦 地 做 同一 件 事 ， 而 且 不 会 累 ; 

(3) 记忆 力 好 ， 积 累 的 经 验 可 以 被 随时 调用 ; 

(4) 没有 情感 等 主观 因素 ， 比 人 类 能 更 公正 、 客 观 地 对 待 每 
个 方案 。 

这 四 个 优势 可 以 使 计算 机 在 解决 超 复杂 的 纯 智 商 难题 时 不 断 探 
索 新 方案 ， 不 断 积累 经 验 ， 不 断 优化 方案 ， 通 过 穷 举 和 对 比 ， 找 
出 最 佳 的 答案 。 人 工 智 能 在 不 同 领域 积累 的 经 验 增加 ， 它 对 事物 
间 关 系 的 洞察 力也 会 逐步 提高 ， 它 也 会 不 断 反哺 提高 自己 解决 问 
题 的 能 力 。 当 人 工 智 能 的 运算 能 力 、 分 析 能 力 、 洞 察 能 力 超越 人 
类 时 ， 人 工 智 能 在 很 多 领域 提供 的 解决 方案 就 会 优 于 人 类 。 

但 是 目前 的 人 工 智 能 属于 弱 人 工 智 能 ， 李 开 复 老师 在 《人 工 
智能 》 一 书 中 总 结 了 弱 人 工 智 能 暂时 无 法 拥有 人 类 的 以 下 能 力 : 

(1) 存在 不 确定 因素 时 进行 推理 、 使 用 策略 解决 问题 、 制 定 
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决策 的 能 力 ; 

(2) 知识 表示 的 能 力 ， 包 括 常 识 性 知识 的 表示 能 力 ; 

(3) 规划 能 力 ; 

(4) 学 习 能 力 ; 

(5) 使 用 自然 语言 进行 交流 沟通 的 能 力 ; 

(6) 将 上 述 能 力 整合 起 来 实现 既定 目标 的 能 力 。 

除 上 述 几 点 之 外 ， 人 工 智能 没有 人 类 的 跨 领域 推理 、 抽 象 类 
比 能 力 ， 也 没有 人 类 的 主观 能 力 如 灵感 、 感 觉 和 感受 ， 更 没有 人 
类 特有 的 灵魂 、 爱 、 意 识 、 理 想 、 意 图 、 同 理 心 、 价 值 观 、 人 生 
观 等 "9, 这 导致 人 工 智能 在 未 来 很 长 一 段 时 间 内 都 无 法 很 好 地 理解 
人 类 的 心理 和 行为 是 什么 ， 在 解决 推理 和 情感 问题 时 效率 和 结果 
都 会 不 尽 人 意 。 

设计 除了 解决 问题 外 ， 还 涉及 对 美的 理解 和 创作 。 美 感 是 对 美 
的 体会 和 感受 ， 它 是 复杂 的 ， 包 含 了 历史 、 文 化 、 环 境 、 情 感 等 客 
观 和 主观 因素 ， 所 以 在 不 同 的 时 代 、 阶 级 、 民 族 和 地 域 中 ， 有 着 不 
同文 化 修养 和 个 性 特征 的 人 对 美的 定义 也 不 同 。 由 于 弱 人 工 智能 缺 
乏 人 类 的 主观 感受 以 及 对 当代 世界 和 社会 的 文化 和 环境 的 理解 能 力 ， 
所 以 目前 的 弱 人 工 智 能 对 美感 基本 一 无 所 知 。 但 人 工 智 能 不 懂 美 感 
不 代表 人 教 不 会 机 器 生产 美感 ， 就 像 托 福 和 雅思 ， 即 使 考生 英语 不 
太 好 看 不 太 懂 文章 在 说 什么 ， 只 要 懂 套 路 ， 也 能 考 出 一 个 还 行 的 成 绩 。 





个 ”如果 读 者 对 人 工 智 能 能 否 模拟 人 类 的 思维 模式 感 兴趣 , 请 阅读 人 工 智 能 专家 马 文 * 明 
斯 基 (Marvin Minsky) 编写 的 《情感 机 器 》 和 《心智 社会 》。 
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因此 人 工 智 能 只 能 依赖 数据 和 经 验 来 解决 问题 ， 它 能 解决 大 
部 分 智力 可 解决 的 问题 ， 但 解决 不 了 大 部 分 需要 推理 、 情 感 和 美 
感 才能 解决 的 问题 。 


3.2.2 ”设计 师 擅 长 的 领域 有 哪些 


上 文 已 提 到 ， 人 工 智 能 在 解决 超 复杂 纯 智力 难题 上 最 终 会 超 
越 人 类 ， 而 且 可 以 生产 出 可 被 公式 化 (规范 化 的 设计 ， 例 如 符 
合 规范 可 批量 生产 的 平面 设计 、 符 合 规范 已 成 熟 的 网 页 和 移动 端 
交互 设计 。 但 对 于 人 工 智能 ， 设 计 师 不 用 过 多 担心 被 取代 问题 ， 
因为 设计 师 的 工作 是 为 了 提高 体验 和 满意 度 ， 体 验 和 满意 度 都 是 
主观 的 ， 这 是 人 工 智 能 很 难 去 衡量 的 。 而 且 设 计 师 擅长 的 领域 基 
本 都 是 目前 的 弱 人 工 智 能 不 擅长 的 ， 包 括 了 以 下 方面 : 

1) 跨 领 域 推理 

人 类 强大 的 跨 领 域 联想 、 类 比 能 力 是 跨 领域 推理 的 基础 。 这 
正 是 设计 师 所 需要 的 技能 ， 即 如 何 通过 跨 界 联想 进行 设计 创新 ， 
如 何 通过 类 比 能 力 去 推理 出 用 户 想 要 什么 。 

2) 抽象 能 

抽象 是 想象 力 中 最 重要 的 部 分 ， 设 计 师 最 需要 的 就 是 想象 力 
和 创意 。 

3) “ 知 其 然 ， 也 知 其 所 以 然 ” 

这 是 学 习 中 最 重要 的 能 力 之 一 。 设 计 师 通过 多 个 实例 找 出 其 
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中 本 质 及 其 产生 的 原因 ， 提 炼 出 用 户 的 需求 ， 再 通过 具象 思维 提 
出 设计 方案 。 

4) 常识 

常识 是 所 有 人 都 认可 以 及 无 须 仔 细 思 考 就 能 直接 使 用 的 知识 、 
经 验 或 方法 .设计 师 经 常 讲 的 灵感 就 由 这 些 知 识 、 经 验 和 方法 构成 。 

5) 审美 

审美 能 力 同样 是 人 类 独 有 的 特征 ， 很 难 用 技术 语言 解释 ， 更 
难 赋予 机 器 。 审 美 是 一 件 非常 个 性 化 的 事情 ， 每 个 人 心中 都 有 自 
己 一 套 关于 美的 标准 ， 但 审美 又 可 以 被 语言 文字 描述 和 解释 ， 人 
与 人 之 间 可 以 很 容易 地 交换 和 分 享 审美 体验 。 这 种 神奇 的 能 力 ， 
计算 机 目前 几乎 完全 不 具备 。 

6) 自我 意识 与 情感 

情感 是 我 们 人 类 的 感性 基础 ， 再 结合 人 类 的 自我 意识 即 是 我 
们 常 说 的 “灵魂 ”。 最 好 的 艺术 作品 或 者 设计 作品 都 是 有 灵魂 的 ， 
当 第 一 次 看 到 或 使 用 它们 时 ， 大 多 数 人 会 感受 到 内 心 的 震撼 。 同 
理 , 设计 需要 考虑 用 户 的 感受 , 这 也 是 常 说 的 同 理 心 和 情感 化 设计 。 
计算 机 目前 只 能 通过 数学 建 模 用 文字 或 者 人 的 表情 来 推断 出 人 类 
情感 ， 但 还 做 不 到 延续 用 户 的 开心 或 者 安慰 用 户 的 伤心 ， 更 不 用 
说 与 人 类 进行 灵魂 交流 。 

以 上 几 点 正 是 设计 师 最 擅长 的 ， 还 有 人 对 于 复杂 系统 的 综合 分 
析 、 决 策 能 力 ， 对 于 艺术 和 文化 的 审美 能 力 和 创造 性 思维 ， 由 生活 
经 验 及 文化 一 陶 产生 的 直觉 、 常 识 ， 基 于 人 自身 的 情感 〈 爱 、 恨 、 
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热情 、 冷 漠 等 ) 与 他 人 互动 的 能 力 …… 这 些 都 是 人 工 智能 所 不 擅长 的 。 
最 后 ， 在 过 去 60 年 里 计算 机 更 多 被 用 来 增强 人 类 智能 ， 人 工 
能 只 是 一 个 辅助 工具 。 汉 斯 。 莫 拉 维 克 (Hans Moravec) ?在 
1998 年 发 表 的 文章 《 当 计 算 机 硬件 与 人 类 大 脑 相 媲美 时 》 提 出 了 
一 个 “人 类 能 力 地 形 图 ”的 观点 ， 其 中 海拔 高 度 代表 这 项 任务 可 
被 计算 机 执行 的 难度 ， 不 断 上 涨 的 海平 面 代表 计算 机 现在 能 做 的 
事情 。 当 计算 机 攻克 一 个 领域 时 ， 海 平面 就 会 上 升 ， 从 而 淹没 掉 
这 个 领域 ， 露 在 海平 面 之 上 的 部 分 ， 就 是 计算 机 还 没 攻克 而 我 们 
人 类 擅长 的 领域 。 从 图 中 可 以 看 出 ， 目 前 人 工 智 能 水 平面 预警 线 
距离 代表 艺术 的 山峰 还 很 远 。 因 此 设计 师 完全 不 用 杞 人 忧 天 ， 担 
心 自己 被 人 工 智 能 取代 。 





编程 
威 诺 格拉 德 测试 


定理 验证 
危险 边缘 
电视 节目 
象棋 
死记 硬 背 算数 





人 类 能 力 地 形 图 





@ 汉 斯 。 莫 拉 维 克 : 卡 内 基 梅 隆 大 学 移动 机 器 人 实验 室 主任 。 著 作 有 《智力 后 裔 : 机 
器 人 和 人 类 智能 的 未 来 》《 机 器 人 : 通 向 非凡 思维 的 纯粹 机 器 》。 


@@ 参考 了 迈克 斯 * 泰 格 马克 (Max Tegmark) 所 著 书 籍 Life 3.0 中 的 “人 类 能 力 地 形 图 ”。 
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3.3 AI 时代 下 设计 师 的 机 遇 与 挑战 


作为 一 项 引领 未 来 的 战略 技术 ， 世 界 发 达 国 家 纷纷 对 人 工 智 
能 的 核心 技术 、 顶 尖 人 才 、 标 准 规范 等 进行 部 署 ， 加 快 促进 人 工 
智能 技术 和 产业 发 展 ， 希 望 在 新 一 轮 国际 竞争 中 掌握 主导 权 。 我 
国 在 最 近 两 年 出 台 了 多 项 关于 人 工 智 能 的 计划 ， 包 括 《 新 一 代 人 
工 智能 发 展 规划 》《 促 进 新 一 代 人 工 智能 产业 发 展 三 年 行动 计划 
(2018 一 2020 年 ) 》《 高 等 学 校 人 工 智 能 创新 行动 计划 》《 中 国 
人 工 智能 系列 白皮书 2017》《 人 工 智 能 标准 化 白皮书 2018》; 来 
自 清华 大 学 、 南 京 大 学 、 西 安 交 通 大 学 等 国内 26 所 大 学 建议 在 本 
科 / 硕 士 陆续 开展 人 工 智 能 专业 ; 另外 ， 浙 江 、 北 京 以 及 另外 几 
个 省 市 已 经 确定 将 把 Python 编程 基础 纳入 信息 技术 课程 和 高 考 的 
内 容 体系 ， 多 所 中 学 成 为 首 批 “ 人 工 智 能 教育 实验 基地 学 校 ”， 
还 有 最 近 首部 《人 工 智能 基础 (高 中 版 )》 正 式 走 进 高 中 课堂 。 
相信 在 未 来 5 年 里 ， 将 会 有 一 大 批 掌握 各 种 人 工 智 能 技术 的 应 届 
生 进入 社会 与 我 们 一 起 竞争 ， 到 时 场景 会 相当 激烈 。 

加 上 新 一 代 设计 师 是 “与 互联 网 共同 成 长 的 一 代 ”， 在 少 
年 时 代 就 接触 了 更 多 的 新 鲜 事物 ， 相 信和 在 未 来 几 年 里 有 更 多 的 
新 晋 设计 师 会 掌握 编程 开发 以 及 其 他 能 力 ， 综 合 素质 会 比 目 前 
的 设计 师 更 强 ， 所 以 ， 我 们 一 定 要 保持 终身 学 习 ， 人 懂得 如 何 将 
自己 的 能 力 和 经 验 转换 为 优势 ， 这 样 才能 更 好 地 在 设计 道路 上 
不 被 超越 。 





= 一 03 


| Al 改变 设计 | 人 工 智 能 时 代 的 设计 师 生 存 手册 


3.3.1 将 经 验 转换 为 更 多 价值 


每 一 代 人 都 有 被 下 一 代 人 取代 的 风险 ， 但 为 什么 有 些 很 厉害 
的 人 就 不 容易 被 取代 ? 理由 很 简单 ， 因 为 他 们 在 不 断 创造 价值 。 
无 论 是 在 社会 、 行 业 还 是 企业 里 ， 当 具备 一 定 影响 力 后 ， 他 们 能 
更 容易 积累 人 脉 和 资源 ， 然 后 反哺 自己 的 价值 ， 就 跟 滚 雪 球 一 样 ， 
当 雪 球 越 大 , 他 们 越 不 容易 被 别人 取代 。 设 计 师 需 要 有 这 样 的 意识 。 








3.3.2 ”掌握 更 多 设计 技能 


未 来 将 有 更 多 的 AR/VR 应 用 和 游戏 出 现在 用 户 视野 ， 三 维 设 
计 、 动 画 设计 和 游戏 设计 一 定 是 新 的 潮流 方向 ， 而 且 这 些 设计 软 
件 和 技法 都 比 现 有 的 UI 设计 复杂 得 多 ， 每 个 控件 都 有 可 能 根据 现 
实生 活 中 的 实物 进行 三 维 设计 ， 因 此 可 能 会 有 更 多 的 控件 形态 以 
及 数量 需要 设计 师 考 虑 ， 最 困难 的 是 如 何 将 以 上 设计 和 技术 进行 
整合 ， 做 出 更 贴近 用 户 的 产品 。 








在 HoloLens 眼镜 里 看 到 的 界面 设计 
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Adobe 正在 帮助 设计 师 和 开发 者 简化 构建 AR 对 象 的 流程 。 
Adobe 在 2018 年 6 月 发 布 了 一 款 用 于 创作 AR 的 工具 Project 
Aero， 它 由 Adobe 和 苹果 、 上 皮克斯 共同 合作 开发 而 成 。Project 
Aero 是 一 款 多 平台 工具 ， 可 帮助 设计 师 将 图 形 带 到 增强 现实 空 
间 。 设计 师 可 以 先 在 Photoshop CC 和 Dimension CC 中 设计 图 形 ， 
然后 再 导出 为 Project Aero 文件 。 接 下 来 Project Aero 利用 平板 
计算 机 来 确定 图 形 的 AR 元 素 以 及 预览 AR 空间 中 的 改动 ， 最 后 
导出 USDZ 文件 供 苹果 ARKit 使 用 。Adobe 首席 技术 官 Abhay 
Parasnis 强调 : “今天 的 AR 内 容 开 发 还 需要 创造 力 和 技术 技能 
的 结合 。Project Aero 将 为 开发 者 和 创意 人 员 提 供 一 个 系统 ， 帮 
助 他 们 利用 苹果 ARKit 来 构建 简单 的 AR 场景 和 体验 。 设 计 人 员 
可 以 轻松 创建 沉浸 式 内 容 ， 然 后 将 其 带 到 Xcode 以 进一步 完善 和 
开发 。” 








设计 师 正 在 用 Project Aero 预览 自己 的 设计 
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除了 界面 设计 ， 在 我 们 身边 将 有 更 多 的 设备 连接 上 物 联网 ， 
我 们 该 如 何 设计 软件 和 硬件 的 关系 ? 设备 和 设备 之 间 如 何 交 
互 ? 这 些 设备 又 应 该 如 何 服务 人 类 ? 当 这 些 设备 出 现 问题 时 ， 
会 对 用 户 生活 产生 多 大 影响 ? 用 户 该 如 何 自行 修复 ? 当 你 的 设 
计 不 周全 有 漏洞 ， 可 能 会 对 用 户 生活 带 来 直接 影响 和 困扰 ， 所 
以 设计 师 一 定 要 谨 记 : 影响 越 大 ， 责 任 越 大 。 总 而 言 之 ， 在 通 
用 人 工 智能 来 临 之 前 ， 设 计 师 还 有 很 多 问题 需要 学 习 和 解决 ， 
这 时 候 就 需要 设计 师 尽 快走 出 舒适 区 去 学 习 新 的 知识 ， 掌 握 更 
多 本 领 











3.3.3 ”结合 Al 进行 思考 和 设计 


既然 AI 是 一 个 强大 的 工具 ， 那 么 我 们 要 思考 如 何 运用 它 来 创 
造 更 多 的 价值 。 在 第 2 章 提 及 的 Alex Da Kid 通过 AI 技术 分 析 过 
去 5 年 里 的 热点 话题 和 流行 音乐 主题 ， 打 造 了 一 首 能 容纳 干 万 伤 
心事 的 歌曲 Not Easy 冲 上 了 Spotify 全 球 榜 第 2 名 ; 时 装 设计 师 
Jason Grech 通过 AI 技术 捕捉 过 去 十 年 的 T 人 台 时 尚 图像 和 实时 的 
社交 信息 ， 从 中 汲取 新 的 灵感 并 预测 出 新 的 潮流 趋势 。 这 两 个 例 
子 说 明 AI 能 快速 便捷 地 获取 大 量 信 息 ， 帮 助 设计 师 拓展 自己 的 视 
野 ， 不 断 更 新 自己 的 世界 观 ， 从 新 的 视角 看 待 问题 和 解决 问题 
除了 快速 获取 信息 外 ， 设 计 师 也 应 该 考虑 如 何 通过 AI 提高 自己 的 
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工作 效率 ， 例 如 哪些 纯 劳动 力 工作 交 给 AI 去 做 效率 会 更 高 ， 哪 些 
工作 可 以 和 AI 一 起 协同 完成 更 能 激发 创意 。 
此 外 ,还 有 更 重要 的 一 点 ， 那 就 是 一 定 要 拓宽 自己 的 想象 力 ， 

将 新 的 技术 和 设计 技能 运用 到 现 有 的 领域 或 者 行业 上 。 举 一 个 例 
子 , 美国 广播 电视 行业 在 2017 年 开始 尝试 提高 视频 的 播报 质量 ， 
设计 师 从 电影 拍摄 中 找到 灵感 ， 随 后 搭建 了 一 个 “沉浸 式 绿 幕 
工作 室 ”。 通 过 AR 技术 和 演员 的 精 淇 表演， 充满 视觉 震撼 的 
天 气 预报 不 仅 能 让 美国 人 民 深 刻 了 解 到 美国 30 年 来 最 强 “ 怪 兽 
级 ”飓风 “佛罗伦萨 ” 带 来 的 影响 ， 还 能 提高 他 们 对 气象 灾害 
的 认 知 。 











观看 视频 了 解 更 多 


天 气 预报 员 解 说 “佛罗伦萨 ”造成 的 影响 
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天 气 预 报 员 在 飓风 来 临时 物体 乱 飞 的 模拟 情景 中 


Facebook Messenger 在 全 球 范围 内 发 行 了 首 批 两 款 AR 视 
频 聊 天 游戏 Don’t Smile 和 Asteroids Attack。Don’t Smile 是 一 
款 互相 对 视 、 看 谁 先 笑 的 游戏 ; Asteroids Attack 则 是 移动 面部 
以 导航 一 架 太 空 飞船 避 开 岩石 和 拾取 镭射 光束 能 量 的 游戏 。 而 
竞争 对 手 Snapchat 却 专注 于 用 AR 占据 用 户 的 整个 屏幕 ， 希 望 
将 用 户 传送 至 外 太空 或 迪斯科 和 舞厅。 在 视频 聊天 时 ， 对 于 远 在 
干 里 又 希望 与 家 人 或 者 朋友 共度 更 多 时 光 的 用 户 来 说 ， 上 述 游 
戏 不 仅仅 是 消磨 时 间 的 有 趣 方式 ， 更 是 一 种 可 促进 情感 交流 的 
新 型 纽带 。 
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Snapchat AR 视频 聊天 游戏 


3.3.4 深耕 艺术 设计 


如 果 不 想 被 人 工 智 能 领先 , 人 类 的 设计 应 该 是 创新 的 (未 成 熟 、 
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未 被 发 现 规律 的 ) ， 包 含 更 多 元 素 的 (更 多 复杂 参数 如 历史 、 文 
化 、 环 境 、 情 感 等 ) , “艺术 ”这 个 词语 就 涵盖 了 以 上 元 素 。 艺 术 
是 灵魂 的 表达 , 人 工 智能 在 艺术 设计 上 还 远 远 达 不 到 人 类 的 水 平 ， 
学 习 艺术 设计 将 会 为 设计 师 带 来 更 多 的 机 会 。 

如 何 结合 人 机 交互 以 及 人 工 智 能 进行 艺术 设计 是 未 来 的 一 个 
设计 方向 ， 近 年 来 有 越 来 越 多 的 智能 互动 艺术 设备 出 现在 各 类 艺 
术 展 中 。 在 多 伦 多 2017 年 设计 创新 与 技术 博览 会 上 ， 多 学 科 艺 术 
家 兼 建筑 师 Philip Beesley 将 大 量 的 技术 和 系统 融入 自己 的 创作 作 
品 Astrocyte 中 。Astrocyte 是 一 个 “ 活 ” 雕 塑 ， 这 个 艺术 品 集合 
了 化 学 、3D 打印 、 人 工 智 能 和 沉浸 音 景 等 诸多 元 素 ， 它 能 根据 周 
围观 众 的 行动 做 出 光 、 声 音 、 振 动 等 模式 给 予 观众 回应 。 




















智能 互动 雕塑 Astrocyte 
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如 果 想 对 人 工 智能 艺术 了 解 更 多 ， 可 以 阅读 谭力 勤 教授 写 的 
《 奇 点 艺术 : 未 来 艺术 在 科技 奇 点 冲击 下 的 旷 变 》 一 书 ， 里 面 有 
更 多 的 人 工 智 能 艺术 案例 ， 可 帮助 大 家 拓展 自己 的 视野 。 





3.3.5 个 性 化 设计 


在 互联 网 和 移动 互联 网 时 代 ， 由 于 产品 用 户 量 大 以 及 技术 的 
限制 ， 产 品 无 法 针对 每 位 用 户 在 不 同 场景 下 的 需求 进行 设计 ， 所 
以 产品 功能 只 能 满足 绝 大 部 分 用 户 都 有 的 核心 场景 。 此 外 ， 鉴 于 
每 位 用 户 审美 能 力 的 差异 ， 设 计 师 只 能 考虑 用 更 简洁 的 设计 语言 
来 满足 大 部 分 用 户 的 基础 审美 。 

在 人 工 智 能 时 代 下 ， 当 产品 基本 都 能 满足 用 户 需求 时 ， 能 
为 产品 带 来 活力 和 差异 的 除了 自身 的 底层 技术 基础 ， 更 多 是 艺术 
型 设计 师 的 理念 和 风格 ， 以 及 自身 品牌 。 就 像 时 尚 品牌 优 衣 库 和 
Gucci， 单 件 商品 两 者 的 品牌 和 设计 所 带 来 的 利润 差 巨 大 ， 相 信 未 
来 的 人 工 智能 产品 也 会 面临 类 似 的 问题 ， 设 计 师 应 该 考虑 如 何 为 
产品 赋予 更 多 价值 ， 如 何 彰显 用 户 的 个 性 。 

在 人 工 智 能 的 帮助 下 ， 产 品 有 能 力 做 到 根据 用 户 的 使 用 场景 
和 行为 分 析出 用 户 的 当前 诉求 ， 并 提供 相应 服务 。 人 工 智 能 为 个 
性 化 服务 提供 了 基础 ， 个 性 化 服务 意味 着 要 考虑 更 多 关于 该 名 用 
户 的 特点 ， 包 括 他 的 文化 、 经 历 、 心 理 等 因素 ， 如 何 设计 出 一 个 
更 具 包 容 、 更 能 满足 用 户 个 体 的 产品 , 将 是 一 个 全 新 的 机 会 和 挑战 。 
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3.3.6 ”学 会 跨 界 思考 


在 近 百 年 诺 贝尔 奖 中 有 41% 的 获奖 者 属于 交叉 学 科 。 尤 其 在 
20 世纪 最 后 25 年 ，95 项 自然 科学 奖 中 ， 交 叉 学 科 领 域 有 45 项 ， 
占 获奖 总 数 的 47.4%， 也 就 是 将 近 一 半 。 还 有 前 面 提 到 的 人 工 智 
能 艺术 ， 需 要 艺术 家 懂得 更 多 领域 的 知识 和 技术 才能 拓宽 自己 的 
视野 ， 这 些 领 域 包 括 但 不 局 限于 传 感 技术 、 网 络 技术 、 智 能 仿真 
技术 、 虚 拟 技术 、 生 物 技术 、 纳 米 技术 等 。 因 此 科学 与 艺术 是 可 
以 并 且 很 有 必要 相通 与 交融 的 ， 设 计 师 一 定 要 学 会 跨 界 思 

人 工 智能 时 代 下 ， 数 字 世 界 和 物理 世界 会 逐渐 融合 ， 大 到 城 
市 建设 、 公 共 服 务 、 衣食住行 和 医疗 ; 小 到 智能 家 居 、 穿 戴 式 设备 ， 
这 些 机 会 将 会 留 给 已 准备 好 的 挑战 者 ， 所 以 设计 师 一 定 要 拓宽 自 
己 的 视野 ， 不 要 把 自己 的 目光 局 限 在 界面 设计 上 。 本 书 的 后 半 部 
分 采访 了 三 名 设计 师 ， 我 们 可 以 从 他 们 身上 学 习 如 何 跨 界 思考 以 
及 拓宽 自己 的 视野 。 
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4.1 多 横 态 交 开 


在 过 去 半 个 世纪 里 ， 计 算 机 经 历 了 大 型 机 计算 、 桌 面 计算 、 
移动 计算 三 个 发 展 阶段 ， 同 时 人 机 交互 的 发 展 从 穿孔 卡片 到 命令 
行 再 到 图 形 界面 ， 新 一 代 人 机 交互 界面 都 比 上 一 代 更 为 自然 和 直 
观 。 在 传统 的 人 机 交互 模式 下 ， 需 要 用 户 在 计算 机 面前 ， 通 过 对 
键盘 、 鼠 标 等 设备 进行 操作 才能 获取 信息 和 服务 ， 尽 管 图 形 界面 
变 得 更 为 友善 ， 但 也 需要 用 户 掌握 一 定 的 操作 方法 才能 体验 到 计 
算 机 带 来 的 方便 和 好 处 。 随 着 更 多 设备 的 互联 网 化 ， 对 于 没有 机 
会 接受 相关 教育 的 人 群 来 说 ， 计 算 机 把 他 们 的 生活 变 得 更 复杂 和 
更 费力 。 

这 半 个 世纪 的 计算 机 发 展 主要 以 技术 为 中 心 ， 而 不 是 以 人 为 
中 心 , 主要 原因 是 当时 的 计算 机 仍然 无 法 理解 用 户 的 行为 和 意图 ， 
以 及 用 户 产生 的 非 结 构 化 数据 。 所 以 基本 上 是 用 户 学 习 如 何 和 计 
算 机 交互 ， 而 我 们 提倡 的 “以 用 户 为 中 心 的 设计 ”更 多 是 指 在 这 
个 程度 上 如 何 降 低 学 习 的 门槛 。 

在 《人 机 交互 中 的 体态 语言 理解 》 一 书 中 ， 徐 光 社 教授 把 传 
统 的 人 机 交互 定义 为 “ 显 式 人 机 交互 ”， 它 的 特点 包括 以 下 4 点 : 


114 一 一 


| 第 4 章 人工 智能 时 代 下 交互 设计 的 改变 | 


(1) 计算 机 只 是 被 动 地 等 待命 令 和 信息 ， 否 则 它 不 会 工作 。 
因此 ， 与 计算 机 交互 必须 有 相应 的 接口 。 在 桌面 计算 模式 下 ， 用 
户 需要 在 计算 机 面前 通过 接口 设备 才能 使 用 计算 机 。 

(2) 计算 机 无 视 用 户 的 状态 和 需求 ， 不 会 主动 地 提供 服务 。 

(3) 计算 机 对 用 户 的 响应 或 服务 是 事先 定义 的 ， 难 以 按照 用 
户 当前 的 状态 和 需求 做 必要 的 调整 。 

(4) 计算 机 只 接受 它 所 能 接受 的 命令 ， 也 就 是 符合 计算 机 规 
定格 式 的 命令 ， 而 不 顾及 用 户 的 文化 背景 和 习惯 如 何 ， 包 括 所 使 
用 的 文字 。 

尽管 传统 的 人 机 交互 看 起 来 是 笨拙 的 , 但 是 当 我 们 回 望 过 去 ， 
输入 /输出 设备 的 发 展 一 直 都 在 从 更 多 维度 或 者 更 深层 次 上 满足 
人 类 需求 ， 人 类 可 以 在 多 维度 下 进行 创造 和 体验 ， 计 算 机 、 网 络 
和 数字 技术 正在 深刻 地 改变 人 类 的 生活 。 





4.1.1 普 适 计算 


其 实在 很 早 之 前 已 经 有 研究 学 者 在 研究 人 类 如 何 更 好 地 与 计 
算 机 进行 交互 ，1988 年 美国 施乐 (Xerox) 公司 PARC 研究 中 心 
的 Mark Weiser 提出 了 “ 普 适 计算 ”这 个 概念 。Mark Weiser 认为 
新 一 代 计 算 机 应 该 具有 以 下 特征 : 它 是 许多 高 度 分 散 和 互联 的 、 
可 融入 自然 环境 中 的 、 不 可 见 和 不 需要 人 们 有 意识 操作 或 分 散 注 
意 力 的 计算 机 。 普 适 计算 的 目的 是 建立 一 个 充满 计算 和 通信 和 能力 
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的 环境 ， 把 信息 空间 与 人 们 生活 的 物理 空间 进行 融合 ， 在 这 个 融 
合 空间 中 人 们 可 以 随时 、 随 地 、 透 明 地 获得 数字 化 服务 ， 计 算 机 
设备 可 以 感知 周围 的 环境 变化 ， 从 而 根据 环境 变化 以 及 用 户 需要 
自动 做 出 相对 应 的 改变 。 

普 适 计算 的 促进 者 希望 嵌入 到 环境 或 日 常 工 具 中 的 计算 能 够 
使 人 更 自然 地 和 计算 机 交互 ， 但 阻碍 普 适 计算 发 展 的 最 大 原因 是 
计算 机 还 不 能 根据 传感器 数据 来 识别 和 理解 人 们 的 情绪 、 态 度 、 
意愿 等 内 心 活动 ， 从 而 无 法 以 人 们 所 习惯 的 方式 与 人 们 进行 信息 
交流 和 提供 主动 的 服务 。 

近年 来 比较 热门 的 物 联网 可 以 认为 是 普 适 计算 的 锥 形 ， 多 
个 小 型 、 便 宜 的 互联 网 设备 广泛 分 布 在 日 常生 活 的 各 个 场所 中 ， 
通过 相互 连接 的 方式 服务 用 户 。 计 算 机 设备 将 不 只 依赖 命令 行 、 
图 形 界面 进行 人 机 交互 ， 可 以 用 更 自然 、 更 隐形 的 方式 与 用 户 
交互 ， 这 样 的 用 户 界面 被 称 为 “自然 用 户 界 面 ” (Natural User 
Interface，NUI) 。NUI 更 多 是 一 种 概念 ， 它 的 “自然 ”是 相对 图 
形 用 户 界 面 而 言 的 ， 它 提倡 用 户 不 需要 学 习 ， 也 不 需要 鼠标 和 键 
盘 等 辅助 设备 。 微 软 的 游戏 操控 设备 Kinect 有 一 句 经 典 广告 语 : 
You are the controller 〈 你 就 是 遥控 器 ) ， 人 类 可 通过 多 模 态 的 交 
互 方式 直观 地 与 计算 机 进行 交互 。 

所 谓 “ 模 态 ” (Modality) ， 是 德国 生理 学 家 赫 尔 姆 霍 茨 提 
出 的 一 种 生物 学 概念 ， 即 生物 凭借 感知 器 官 和 经 验 接收 信息 的 通 
道 ， 例 如 和 人 类 有 视觉 、 听 觉 、 触 觉 、 嗅 觉 和 味觉 5 种 模 态 。 由 学 
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者 研究 得 知 ， 人 类 感知 信息 的 途径 里 ， 通 过 视觉 、 听 觉 、 触 
嗅觉 和 味觉 获取 外 界 信息 的 比例 依次 为 83%、11%、3.5%、1.5% 
和 1% 。 多 模 态 是 指 将 多 种 感官 进行 融合 ， 而 多 模 态 交互 是 指 人 通 

、 肢 体 语言 、 信 息 载 体 (文字 、 图 片 、 音 频 、 视 频 ) 、 环 境 
等 多 个 通道 与 计算 机 进行 交流 ， 充 分 模拟 人 与 人 之 间 的 交互 方式 。 


水 


4.1.2 ”视觉 和 听觉 


先 来 看 一 下 多 模 态 里 的 视觉 和 听觉 ， 视 觉 和 听觉 获取 的 信 
息 比 例 总 和 为 94%， 而 且 是 当前 流行 的 GUI (Graphical User 
Interface， 图 形 用 户 界 面 ) 和 VUI (Voice User Interface， 语 音 
户 界 面 ) 使 用 的 两 个 通道 。 

1) 维度 

如 果 问 视觉 和 听觉 最 本 质 的 区 别 是 什么 ， 我 认为 是 传递 信息 
的 维度 不 同 。 眼 睛 接收 的 信息 由 时 间 和 空间 四 个 维度 决定 ， 耳 及 
接收 的 信息 只 能 由 时 间 维 度 决 定 ( 虽 然 耳 灯 能 觉察 声音 的 方向 和 
频率 ， 但 不 是 决定 性 因素 ) 。 有 眼睛 可 以 来 回 观察 空间 获取 信息 ; 
耳 采 只 能 单 向 获取 信息 ， 在 没有 其 他 功能 的 帮助 下 如 果 想 重 听 前 
几 秒 的 信息 是 不 可 能 的 。 

时 间 维 度 决定 了 接收 信息 的 多 少 ， 它 是 单 向 的 、 线 性 的 以 及 
不 能 停止 的 。 耳 采 在 很 短 时 间 内 接收 的 信息 是 非常 有 限 的， 举 一 
个 极端 的 例子 : 假设 人 可 以 停止 时 间 ， 在 静止 的 时 间 内 声音 是 无 
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法 传播 的 ， 这 时 候 是 不 存在 信息 的 。 还 有 一 个 说 法 是 在 静止 的 时 
间 内 ， 声 音 会 保持 在 一 个 当前 状态 例如 “ 滴 ”， 这 时 候 声音 对 人 
类 来 说 就 是 一 种 噪音 。 

耳 采 接收 的 信息 只 能 由 时 间 决 定 ， 眼 睛 却 很 不 一 样 ， 即 使 在 
很 短 的 时 间 内 ， 眼 睛 也 可 以 从 空间 获取 大 量 信息 。 空 间 的 信息 由 
两 个 因素 决定 : @ 动 态 还 是 静态 ; @ 三 维 空间 还 是 二 维 平面 。 在 
没有 其 他 参照 物 的 对 比 下 ， 事 物 的 静止 不 动 可 以 模拟 时 间 上 的 静 
止 , 这 时 候 人 是 可 以 在 静止 的 事物 上 获取 信息 的 。 时 间 和 空间 的 
结合 可 使 信息 大 大 丰富 ， 正 如 花 一 分 钟 看 周围 的 动态 事物 远 比 一 
年 看 同一 个 静态 页 面 获取 的 信息 要 多 。 

2) 接收 信息 量 的 对 比 

视觉 接收 的 信息 量 远 比 听觉 高 。 在 知 平 上 有 神经 科学 和 脑 科 
学 话题 的 优秀 回答 者 指出 ， 大 脑 每 秒 通 过 眼睛 接收 的 信息 上 限 为 
100Mbps， 通 过 耳蜗 接收 的 信息 上 限 为 Mbps。 简 单 点 说 ， 视 觉 
接收 的 信息 量 可 以 达到 听觉 接收 信息 的 100 倍 。 

虽然 以 上 结论 没有 官方 证 实 ， 但 我 们 可 以 用 简单 的 方法 进行 
对 比 。 在 理解 范围 内 ， 人 阅读 文字 的 速度 可 以 达到 500 ~ 1000 字 
每 分 钟 ， 说 话 时 语 速 可 以 达到 200 ~ 300 字 每 分 钟 ， 所 以 视觉 阅 
读 的 信息 可 以 达到 听觉 的 2 ~ 5 售 。 而 当 超 出 理解 范围 时 需要 花 
时 间 思 考 ， 这 导致 了 接收 信息 量 又 降 。 





@ ”以 上 数据 来 自 知 乎 问题 “ 耳 休 和 眼睛 哪个 接收 信息 的 速度 更 快 ? ” 
@ ”以 上 两 个 数据 来 自 知 乎 问题 “普通 人 的 阅读 速度 是 每 小 时 多 少 字 ? ”和 “为 他 人 扎 
写 中 文 演讲 稿 ， 平 均 每 分 钟 多 少 字 比较 合适 ? ” 
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如 果 将 图 像 作为 信息 载体 ， 可 由 视觉 阅读 获得 的 信息 远 超 听 
觉 获 得 的 信息 的 5 倍 。 眼 睛 还 有 一 个 特别 之 处 ， 通 过 扫 视 的 方式 
一 秒 内 可 以 看 到 三 个 不 同 的 地 方 ?。 


4.1.3 ”触觉 


虽然 触觉 接收 的 信息 量 少 于 视觉 和 听觉 ， 但 它 远 比 视觉 、 听 
觉 复 杂 。 触 觉 是 指 分 布 于 人 们 皮肤 上 的 感受 器 在 外 界 的 温度 、 湿 
度 、 压 力 、 振 动 等 刺激 下 ， 所 引起 的 冷 热 、 润 燥 、 软 硬 、 动 作 等 
反应 。 我 们 通过 触摸 感受 各 种 物体 ， 并 将 触摸 到 的 各 种 数据 记 入 
大 脑 , 例如 在 黑暗 情况 下 我 们 可 以 通过 触摸 判断 物体 大 概 是 什么 。 
如 果 我 们 结合 视觉 看 到 一 个 球形 物体 , 但 触摸 它 时 感觉 到 了 棱角 ， 
这 时 会 和 我 们 的 记忆 产生 冲突 。 

在 虚拟 现实 中 ， 五 个 感官 的 同时 协调 是 技术 的 终极 目标 。 如 
果 没 有 触觉 ， 那 就 少 了 实在 和 自然 的 感觉 ， 例 如 在 格斗 游戏 中 无 
论 是 敌人 被 击 中 或 者 是 自己 被 击 中 都 没有 反应 回馈 ， 导 致 游戏 体 
验 缺 乏 真实 感 。 虚 拟 现实 控制 系统 应 该 尽 可 能 自然 地 模拟 我 们 
与 周边 环境 的 交互 。 同 理 ， 未 来 的 人 机 交互 更 多 发 生 在 物理 空 
间 里 ， 人 类 想 要 真实 地 感受 实体 ， 增 强 现实 技术 需要 把 虚拟 的 数 
字 信 息 转化 为 触感 ， 因 为 触感 才 是 我 们 在 真实 环境 下 感受 实体 的 
唯一 途径 。 








@ 以 上 数据 来 自 《 人 工 智 能 的 未 来 》 一 书 。 
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在 现实 世界 中 ， 科 技 公司 希望 借助 形变 和 震动 来 模拟 各 种 材 
质 的 触感 ， 即 虚拟 触觉 技术 。 之 前 ， 在 众 筹 网 站 Kickstarter 上 就 
出 现 过 一 种 虚拟 现实 手套 一 一 Gloveone。 这 种 手套 中 加 入 了 很 多 小 
电动 机 ， 通 过 不 同 频率 和 强度 的 振动 来 配合 视觉 效果 。 类 似 的 还 
有 一 款 叫 作 HandsOmni 的 手套 ， 由 莱 斯 大 学 (Rice University ) 
研发 ， 手 套 里 的 小 气 训 通 过 充气 和 放 气 来 模拟 触觉 ， 相 比 于 电动 
机 来 说 ， 它 的 效果 更 好 ， 但 仍 处 于 研发 的 早期 阶段 。 




















Gloveone 手套 


4.1.4 嗅觉 











在 《 超 普通 心理 学 》 一 书 中 提 到 : 嗅觉 是 五 感 中 传递 唯一 不 
经 过 丘脑 (thalamus) 的 , 而 是 直接 将 刺激 传 到 大 脑 中 许多 与 情感 、 
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本 能 反应 相关 的 腺 体 ， 例 如 杏仁 核 (管理 各 种 情绪 如 愤怒 与 恐惧 、 
和 欲望 与 饥 俄 感 等 ) 、 海 马 体 (管理 长 期 记忆 、 空 间 感受 等 )、 下 丘 
脑 〈 管 理性 欲 和 冲动 、 生 长 激素 与 荷尔蒙 的 分 泌 、 肾 上 腺 素 的 分 
泌 等 ) 、 脑 下 垂体 〈 管 理 各 种 内 分 泌 激 素 ， 也 是 大 脑 的 总 司令 ) ， 
因此 嗅觉 是 最 直接 而 且 能 唤起 人 类 本 能 行为 和 情绪 记忆 的 感官 。 
尽管 如 此 ， 但 目前 聚焦 嗅觉 解决 方案 的 初创 公司 相对 较 少 ， 
2015 年 在 Kickstarter 上 发 起 众 筹 的 FeelReal 公司 就 是 其 中 一 
家 。FeelReal 公司 推出 了 由 头 戴 式 显示 器 以 及 口罩 组 成 的 Nirvana 
Helmet 和 VR Mask， 它 们 能 给 你 更 丰富 的 感官 刺激 ， 例 如 可 以 通 
过 气味 、 水 雾 、 震动 、 风 、 模拟 热 等 给 使 用 者 带 来 全 新 的 五 官 感受 。 
目前 为 止 ，FeelReal 团队 已 经 预先 制作 了 数 十 种 在 电影 、 游 戏 里 
高 频率 出 现 的 气味 ， 同 时 在 设备 中 开发 了 一 个 可 以 同时 放置 7 种 
不 同 气味 发 生 器 的 墨盒 ， 墨 盒 设 置 在 口罩 内 。 可 惜 的 是 ，FeelReal 
在 Kickstarter 上 众 筹 失败 ， 产 品 在 官网 上 仍然 显示 着 “预订 中 ”。 





FeelReal 口罩 
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在 杭州 有 一 家 叫 “ 气 味 王国 ”的 公司 专注 于 数字 嗅觉 技术 研发 。 
目前 气味 王国 通过 解码 、 编 码 、 传 输 、 释 放 等 技术 流程 ， 将 被 还 
原 物 质 的 气味 突破 时 间 与 空间 的 阻隔 ， 按 照 程 序 设 定 用 解码 器 识 
别 指令 进行 即时 的 气味 传输 。 据 介绍 ， 气 味 王国 已 经 收录 了 十 万 
种 气味 , 并 解码 了 上 和 干 种 气味 ,包括 日 常生 活 中 可 接触 到 的 食物 、 
花草 ,汽油 等 平常 气味 , 和 远离 生活 的 受 限 地 理 环 境 中 的 奇特 气味 。 
解码 完成 的 上 干 种 气味 被 装置 在 “气味 盒子 ”中 ， 在 合适 的 场景 
下 , “气味 盒子 ”通过 微机 电 结 构 控制 气味 的 比例 、 组 合 效 果 、 时 
间 节 点 等 ， 实 现 契 合式 的 气味 释放 。 

分 析 完 人 类 如 何 接收 信息 以 及 背后 的 支持 技术 后 ， 接 下 来 再 
分 析 一 下 人 类 如 何 通过 声音 和 肢体 语言 、 信 息 载体 传达 信息 ， 以 
及 现在 的 支持 技术 发 展 到 什么 阶段 。 








4.1.5 ”通过 声音 传达 信息 


了 路 


随 着 人 工 智 能 的 发 展 ， 语 音 识 别 技术 得 到 快速 发 展 ， 在 第 1 章 
已 经 详细 介绍 过 语音 识别 技术 ， 所 以 在 此 不 再 展开 介绍 。 人 在 表 
达 自 己 的 意图 时 主要 由 语言 、 口 音 、 语 法 、 词 汇 、 语 调和 语 速 等 
决定 ， 而 在 不 同 场景 下 用 户 的 语气 也 会 随 着 情绪 而 变化 ， 导 致 相 
同 的 语句 可 能 会 有 不 一 样 的 意图 。 

具备 语音 交互 能 力 的 设备 根据 用 户 响应 做 出 反应 并 进行 有 意 
义 对 话 的 关键 ， 是 智能 情绪 识别 。 早 在 2012 年 ， 以 色 列 的 初创 企 
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业 Beyond Verbal 就 发 明了 一 系列 语音 情绪 识别 算法 ， 可 以 根据 说 
话 方式 和 音域 的 变化 ,分 析出 愤怒 、 焦 虑 、 幸 福 或 满足 等 情绪 , 心情 、 
态度 的 细微 差别 也 能 被 精准 检测 。 至 今 为 止 ， 该 算法 可 以 分 析出 
11 个 类 别 的 400 种 复杂 情绪 。 近 年 来 亚马逊 的 Alexa 团队 和 苹果 
的 Siri 团队 也 在 着 力 研 究 语音 情绪 识别 ， 苹 果 的 最 新 HomePod 广 
告 片 Welcome Home 用 了 类 似 的 方案 来 表达 Siri 的 智能 推荐 : 辛 
苦 了 一 天 的 女 主角 ， 疲 每 不 堪 地 回 到 家 中 ， 让 Siri 用 HomePod 播 
放 音 乐 。 紧 接着 神奇 的 事情 发 生 了 : 音乐 响起 ， 女 主 拥 有 了 魔力 ， 
她 可 以 打开 另 一 个 空间 ， 顿 时 疲劳 的 感觉 一 扫 而 光 ， 尽 情 漫 舞 。 
广告 充分 展示 了 HomePod 在 转换 情绪 上 的 “开关 ”作用 ， 得 到 国 
外 广告 圈 的 一 致 好 评 。 

机 器 除了 需要 理解 用 户 想 表 达 什 么 ， 还 需要 识别 是 哪个 用 户 
在 说 话 , 这 时 候 生物 识别 领域 下 的 “ 声 纹 识别 ”就 能 起 到 关键 作用 ， 
该 技术 通过 语音 波形 中 反映 说 话 人 生理 和 行为 特征 的 语音 参数 ， 
进而 分 辨 出 说 话 人 的 身份 。 苹 果 、 亚 马 逊 和 Google 在 自家 产品 上 
相继 使 用 了 声 纹 识别 , 可 以 有 效 判 断 不 同 用 户 的 声音 并 给 出 响应 。 

声 纹 识别 将 成 为 语音 人 机 交互 的 最 佳 身份 认证 方式 ， 还 可 以 
有 效 减 少 部 分 应 用 场景 下 的 操作 流程 。 例 如 在 下 订单 环节 ， 如 果 
有 了 声 纹 识别 作为 身份 认证 方式 ， 那 么 通过 “ 帮 我 订 昨 天 晚上 一 
样 的 外 卖 ” 这 一 句 话 ， 就 能 够 完成 整个 订餐 及 支付 操作 。 如 果 没 
有 声 纹 识别 ， 到 了 支付 环节 可 能 还 是 需要 通过 智能 手机 上 的 指纹 
识别 或 人 脸 识 别 来 完成 认证 的 步骤 ， 使 用 起 来 非常 麻烦 。 
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同时 ， 由 于 语音 交互 的 便捷 性 ， 在 智能 家 居 设 计 上 可 能 会 有 
较 大 的 问题 。 举 个 例子 ， 当 有 闻 入 者 非法 入 侵 住宅 时 ， 如 果 语 音 
控制 系统 不 限制 说 话 人 的 身份 ， 每 个 人 都 有 着 智能 监控 系统 的 权 
限 ， 那 么 冯 入 者 完全 可 以 直接 下 命令 关闭 监控 系统 ， 这 是 一 件 非 
常 危险 的 事情 。 声 纹 识别 能 有 效 解 决 该 问题 ， 在 不 能 识别 出 间 入 
者 身份 的 前 提 下 ， 当 闯 入 者 尝试 进行 语音 交互 时 ， 语 音 控制 系统 
应 该 进行 报警 等 一 系列 安防 措施 ， 有 效 保障 居民 的 安全 。 


4.1.6 ”通过 肢体 语言 传达 信息 


人 类 交流 时 一 半 依 赖 于 肢体 语言 ， 如 果 没有 肢体 语言 ， 交 流 
起 来 将 十 分 困难 且 费 力 。 肢 体 语言 是 一 种 无 声 的 语言 ， 我 们 可 以 
通过 面部 表情 、 有 眼神、 肢体 动作 等 细节 了 解 一 个 人 当前 的 情感 、 
态度 和 性 格 。 美 国 心理 学 家 爱德华 。 霍 尔 (Edward Hall) 曾 在 《无 
声 语言 》 一 书 说 过 :“ 无 声 语言 所 显示 的 意义 要 比 有 声 语言 多 得 多 ， 
而 且 深 刻 得 多 ， 因 为 有 声 语言 往往 把 所 要 表达 的 意思 的 大 部 分 ， 
甚至 绝 大 部 分 隐藏 起 来 。” 

面部 表情 是 表达 情感 的 主要 方式 。 目 前 大 多 数 研究 集中 在 6 
种 主要 的 情感 上 ， 即 愤怒 、 悲 伤 、 惊 奇 、 高 兴 、 害 怕 和 厌恶 。 目 
前 网 上 已 经 有 很 多 表情 识别 的 开源 项 目 ， 例 如 Github 上 点 赞 数 较 
高 的 Face Classification， 其 基于 Keras CNN 模型 与 OpenCV 进行 
实时 面部 检测 和 表情 分 类 ， 使 用 真实 数据 做 测试 时 ， 表 情 识别 的 
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准确 率 只 达到 66%， 但 在 识别 大 笑 、 惊 讶 等 计算 机 理解 起 来 差 不 
多 的 表情 时 效果 较 差 。 在 人 机 交互 上 ， 用 户 表 情 识 别 除 了 可 以 用 
于 理解 用 户 的 情感 反馈 ， 还 可 以 用 于 对 话 中 发 言 的 轮换 管理 ， 例 
如 机 器 看 到 用 户 表情 瞬间 变 为 愤怒 时 ， 需 要 考虑 流程 是 否 还 继续 
进行 。 

有 时 候 人 的 一 个 眼神 就 能 让 对 方 猜 到 他 想 表 达 什 么 ， 所 以 眼 
睛 被 称 为 “心灵 的 窗户 ”。 眼 睛 是 人 机 交互 的 研究 方向 之 一 ， 它 
的 注视 方向 、 注 视 时 长 、 瞳 孔 扩 张 收缩 以 及 瞬 眼 频率 等 都 有 不 
一 样 的 解读 。2012 年 由 四 个 丹麦 博士 生 创 立 的 公司 The Eye 
Tribe 开发 的 眼 动 追踪 技术 ， 可 以 通过 智能 手机 或 者 平板 计算 机 
的 前 置 摄像 头 获取 图 像 利用 计算 机 视觉 算法 进行 分 析 。 软 件 
能 定位 眼睛 的 位 置 ， 估 计 你 正在 看 屏幕 的 什么 地 方 ， 甚 至 精确 
到 非常 小 的 图 标 。 这 项 眼 动 追踪 技术 未 来 有 望 取代 手指 控制 平 
板 计算 机 或 手机 。 

在 人 机 交互 上 ， 眼 动 追踪 技术 将 帮助 计算 机 知道 用 户 在 看 哪 
里 ， 有 助 于 优化 整个 应 用 、 游 戏 的 导航 结构 ， 使 整个 用 户 界面 更 
加 简洁 明了 。 例 如 ， 地 图 、 控 制 面板 等 元 素 在 用 户 没 关 注 时 可 被 
隐藏 ， 只 有 当 用 户 眼 球 查看 边缘 时 才 显 示 出 来 ， 从 而 增加 整个 游 
戏 的 沉浸 式 体验 。 专 门 研究 眼 动 追踪 技术 的 公司 Tobii Pro 副 总 裁 
Oscar Werner 认为 : “以 眼 动 追 踪 为 主 的 新 一 代 PC 交互 方式 ， 
将 会 结合 触摸 屏 、 和 鼠标、 语音 控制 和 键盘 等 人 机 交互 方式 ， 进 而 
显著 提升 计算 机 操作 的 效率 和 直观 性 。 目 光 比 任何 物理 动作 都 先 
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行 一 步 。 在 眼 部 追踪 的 基础 上 ， 肯 定 还 会 有 更 多 更 “聪明 ”的 用 
户 交 互 方式 诞生 。” 对 以 沉浸 式 体验 为 核心 的 VR 设备 而 言 ， 眼 
动 追踪 技术 是 下 一 代 VR 头 显 的 关键 所 在 ， 刚 刚 提 到 的 The Eye 
Tribe 公司 也 已 被 Facebook 收购 ， 该 技术 将 被 用 于 Oculus 上 。 

肢体 动作 是 涉及 认 知 科学 、 心 理学 、 神 经 科学 、 脑 科学 、 行 
为 学 等 领域 的 跨 学 科研 究 课题 ， 其 中 包含 很 多 细节 ， 甚 至 每 根 手 
指 的 不 同位 置 都 能 传达 不 同 的 信息 ， 因 此 让 计算 机 读 懂 人 类 的 肢 
体 动作 是 一 件 棘 手 的 事 。 

在 肢体 识别 上 ， 最 出 名 的 莫 过 于 微软 的 3D 体感 摄影 机 
Kinect， 它 具备 即时 动态 捕捉 、 影 像 辩 识 、 麦 克 风 输入 、 语 音 辨 
识 等 功能 。Kinect 不 需要 使 用 任何 控制 器 ， 它 依靠 相机 就 能 捕捉 
三 维 空间 中 玩家 的 运动 ， 在 微软 Build 2018 开发 者 大 会 上 ， 微 软 
推出 了 全 新 的 Project Kinect for Azure， 它 将 配置 人 们 熟悉 的 所 
有 功能 ， 而 且 只 配置 了 更 小 规模 但 功效 更 大 的 组 件 。 例 如 ， 新 版 
的 Kinect 前 端 可 以 对 
用 户 手 势 进 行 完整 追 
踪 且 空间 映射 度 高 ; 
而 后 端 可 以 使 用 微软 
Azure 云 平 台 的 机 器 
学 习 、 认 知 服务 以 及 
IoT Edge 等 人 工 智能 











服务 。 用 户 在 使 用 Kinect 传感器 来 玩 体感 游戏 


人 5 一 


| 第 4 章 人工 智能 时 代 下 交互 设计 的 改变 | 


手势 识别 有 两 款 很 不 错 的 硬件 产品 ， 一 款 是 家 喻 户 晓 的 Leap 
Motion， 它 能 在 150” 视 场 角 的 空间 内 以 0.01 毫米 的 精度 追踪 用 
户 的 10 根 手指 ， 让 你 的 双手 在 虚拟 空间 里 像 在 真实 世界 一 样 随意 
挥动 。 另 外 一 款 是 MYO 腕 带 ， 它 通过 检测 用 户 运动 时 胎 膊 上 肌 
肉 产 生 的 生物 电 变化 ， 配 合 手臂 的 物理 动作 监控 实现 手势 识别 。 
MYO 所 具备 的 灵敏 度 很 高 ， 例 如 握拳 的 动作 即使 不 用 力也 能 被 检 
测 到 。 有 时 候 你 甚至 会 觉得 自己 的 手指 还 没 开始 运动 ，MYO 就 已 
经 感受 到 了 ， 这 是 因为 你 的 手指 开始 移动 之 前 ，MYO 已 经 感受 到 
大 脑 控制 肌肉 运动 产生 的 生物 电 了 。 

卡 内 基 梅 隆 大 学 机 器 人 学 院 (CMU RI) 的 副教授 Yaser 
Sheikh 带领 的 团队 正在 研发 一 种 可 以 从 头 到 脚 读 取 肢体 语言 的 计 
算 机 系统 ， 可 以 实时 追踪 识别 大 规模 人 群 的 多 个 动作 姿势 ， 包 括 
面部 表情 和 手势 ， 甚 至 是 每 个 人 的 手指 动作 。2017 年 6 月 和 7 月 ， 
这 个 项 目 在 Github 上 相继 开源 了 核心 的 面部 和 手 部 识别 源 代码 ， 
名 称 为 OpenPose。OpenPose 的 开源 已 经 吸引 了 数 千 用 户 人 参与 完善 ， 
任何 人 只 要 不 涉及 商业 用 途 ， 都 可 以 用 它 来 构建 自己 的 肢体 跟踪 
系统 。 肢 体 语言 识别 为 人 机 交互 开辟 了 新 的 方式 ， 但 整体 的 肢体 
语言 理解 过 于 复杂 ， 计 算 机 如 何 将 肢体 语言 语义 化 并 理解 仍然 是 
一 个 技术 瓶颈 。 
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OpenPose 人 群 肢体 识别 


4.1.7 ”通过 信息 载体 传达 信息 


除了 现场 沟通 ， 人 类 还 会 通过 文字 、 图 片 、 音 频 、 视 频 这 四 
种 媒介 与 其 他 人 沟通 ， 而 这 四 种 载体 承载 的 信息 都 属于 计算 机 难 
以 理解 的 非 结 构 化 数据 。2018 年 百度 AI 开发 者 大 会 上 ， 百 度 高 
级 副 总 裁 王 海峰 发 布 了 百度 大 脑 3.0， 并 表示 百度 大 脑 3.0 的 核心 
是 “多 模 态 深 度 语义 理解 ”， 包 括 数 据 的 语义 、 知 识 的 语义 ， 以 
及 图 像 、 视 频 、 声 音 、 语 音 等 各 方面 的 理解 。 视 觉 语 义 化 可 以 让 
机 器 从 看 清 到 看 懂 图 片 和 视频 ， 识 别人 、 物 体 和 场景 ， 同 时 捕捉 
它们 之 间 的 行为 和 关系 ， 通 过 时 序 化 、 数 字 化 、 结 构 化 的 方式 ， 
提炼 出 结构 化 的 语义 知识 ， 最 终结 合 领域 和 场景 进行 智慧 推理 并 
落地 到 行业 应 用 。 在 人 机 交互 上 ， 计 算 机 理解 非 结构 化 数据 有 助 
于 计算 机 理解 用 户 ， 从 而 优化 个 性 化 推荐 和 人 机 交互 流程 ， 提 高 
产品 整体 的 使 用 效率 和 体验 。 
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总 的 来 说 ， 现 在 的 计算 机 设备 能 较 好 地 看 清 用 户 的 肢体 动作 
以 及 听 清 用 户 的 语言 ， 但 是 仍然 不 能 看 懂 、 听 懂 并 理解 背后 的 语 
义 是 什么 。 当 交互 发 生 在 三 维 的 物理 空间 中 时 ， 由 于 上 下 文 会 随 现 
场 的 任务 以 及 任务 背景 而 发 生动 态 变化 ， 导 致 同样 的 输入 可 能 会 
不 同 的 语义 。 在 短 时 间 内 弱 人 工 智 能 无 法 很 好 地 解决 “语义 ”， 
而 “语义 ”也 将 成 为 未 来 几 年 里 人 机 交互 领域 绕 不 开 的 话题 ， 设 
计 师 需要 学 会 如 何在 人 工 智 能 面前 更 好 地 权衡 并 处 理 “ 语 义 ”。 


4.2 ”移动 产品 交互 设计 的 改变 


在 未 来 几 年 内 ， 人 工 智 能 助手 的 普及 以 及 手机 硬件 形态 的 改 
变 ， 将 会 导致 移动 端 交互 设计 发 生 颠 覆 性 的 改变 ， 包 括 信息 架构 
的 改变 、 流 的 设计 改变 、 拥 有 更 多 新 型 组 件 以 及 多 模 态 交互 的 实现 。 


4.2.1 信息 架构 


要 说 信息 架构 (Information Architecture) @， 首 先 要 提 及 图 
书馆 ， 因 为 图 书馆 应 该 是 最 早 能 体现 出 信息 架构 的 设计 。 当 不 同 
领域 的 书籍 多 到 人 类 无 法 第 一 时 间 找 到 相关 信息 时 ， 为 了 提高 查 





@ 信息 架构 最 早 由 美国 建筑 师 Richard Saul Wurman 在 1976 年 提出 ， 同 时 他 也 是 
TED 的 创立 者 。 面 对 当代 社会 信息 的 不 断 增长 和 爆炸 ，Richard 认为 信息 需要 一 个 
架构 、 一 个 系统 来 合理 设计 ， 因 此 他 创造 了 一 个 全 新 的 术语 一 一 信息 架构 。 
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找 效 率 ， 人 类 开始 给 书籍 添加 索引 ， 分 门 别 类 地 按 区 域 摆 放 不 同 
内 容 的 书籍 ， 这 样 一 来 ， 即 使 是 毫 无 经 验 的 人 ， 在 图 书馆 引导 和 
管理 员 的 帮助 下 也 能 迅速 找到 相关 资料 。 








图 书馆 的 图 书 分 类 


GUI 和 HTML 的 出 现 ， 使 得 信息 架构 得 以 广泛 应 用 ， 同 时 也 
衍生 出 一 个 新 的 术语 一 一 页 面 (Page) 。 在 GUI 时 代 ， 信 息 架 构 主 
要 由 页 面 和 流程 决定 。 由 于 信息 的 展现 必须 由 页 面 承载 ， 而 页 面 承 
载 的 信息 应 该 是 有 限 的 ， 所 以 设计 者 需要 将 信息 合理 放 入 页 面 里 。 

假设 总 信息 和 页 面 内 容 的 信息 是 固定 的 ， 那 么 流程 也 是 固定 
的 ; 反之 亦 然 ， 假 设 页 面 信息 是 固定 的 ， 在 固定 的 流程 上 增加 一 
个 可 以 扩展 信息 的 聚合 页 面 ， 那 么 总 信息 可 以 是 无 限 的 。 当 页 面 
和 流程 设计 被 固定 时 ， 信 息 架构 也 是 固定 的 。 

在 海量 信息 面前 , 固定 的 信息 架构 有 助 于 人 类 记忆 使 用 路 径 ， 
降低 寻找 成 本 。 当 海量 信息 不 断 以 指数 级 增长 ， 功 能 变 得 越 来 越 
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多 时 ， 产 品 需要 更 多 的 页 面 来 承载 。 更 多 页 面 会 导致 产品 架构 的 
层级 和 流程 变 得 更 复杂 ， 也 使 得 用 户 的 使 用 成 本 不 断 增加 ， 这 并 
不 是 一 件 好 事 。 

每 个 人 的 思考 模式 不 是 固定 的 ， 为 了 解决 大 部 分 用 户 需求 而 
设计 的 信息 架构 可 以 帮助 到 用 户 ， 同 时 也 限制 了 用 户 的 思考 。 为 
了 解决 这 个 问题 ， 信 息 架 构 需 要 一 个 优秀 的 导航 设计 来 引导 用 户 
使 用 和 随处 浏览 ， 如 下 图 所 示 。 


特色 主题 行业 频道 生活 服务 更 多 精 先 


京东 商城 网 页 版 的 导航 设计 


为 了 方便 用 户 随心 所 欲 地 挖掘 更 多 信息 ， 搜 索 是 一 条 捷径 ， 
搜索 还 可 以 让 用 户 随时 切换 想 要 寻找 的 内 容 。 


Coogle 


简体 中 文 


名 


Gocgle 汕 安 手气 不 错 


搜索 为 用 户 信息 查询 带 来 便捷 
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由 于 手机 小 屏幕 的 限制 ， 为 了 展现 更 多 内 容 ， 导 航 的 功能 和 
形式 被 削减 ， 主 要 依赖 标签 式 、 抽 屠 式 、 列 表 式 等 导航 模式 以 及 
每 个 子 页 面 的 返回 按钮 。 如 果 产 品 架构 层级 过 深 ， 会 导致 返回 步 
又 过 长 , 如 果 用 户 要 从 一 条 路 径 跳 到 另外 一 条 路 径 , 步骤 极其 烦琐 。 


标签 导航 舵 式 导航 抽 居 导航 宫 格 导航 
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组 合 导航 列表 导航 tab 导航 轮 播 导航 
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手机 应 用 的 常用 导航 设计 


在 页 面 里 ， 不 提供 随时 跳 到 另外 一 个 页 面 的 功能 是 完全 可 以 
理解 的 ， 因 为 这 个 功能 在 展现 上 就 很 难 设计 ， 而 且 可 能 会 使 稳定 
的 信息 架构 变 紊乱 。 但 是 ， 这 个 功能 可 以 降低 用 户 的 操作 成 本 ， 
更 符合 人 的 思维 模式 。 

为 了 实现 这 个 功能 ， 让 用 户 自行 搜索 信息 架构 或 许 是 一 
错 的 选择 。 相 对 于 成 本 很 高 的 文字 输入 ， 人 工 智能 下 的 语音 输入 
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是 目前 最 佳 的 解决 方案 , 语音 助手 的 本 质 也 是 利用 语音 进行 搜索 。 
语音 助手 与 信息 架构 的 结合 并 不 是 一 个 全 新 的 模式 ，iOS 的 Siri 
可 以 打开 手机 应 用 以 及 部 分 苹果 官方 功能 ， 例 如 在 Siri 模式 下 说 
出 “打开 秒表 ”， 就 可 以 直接 打开 时 钟 App 下 的 秒表 页 面 ， 说 出 
“打开 显示 与 亮度 ”， 则 可 以 直接 定位 到 显示 与 亮度 页 面 。 可 惜 
的 是 目前 大 部 分 产品 的 信息 架构 并 不 能 和 系统 级 别 的 语音 助手 进 
行 深度 整合 。 最 近 小 米 、 三 星 等 手机 厂商 通过 “语音 输入 - 模拟 
页 面 触 控 -到 达 页 面 /完成 功能 ”的 方式 实现 信息 架构 的 快速 触 达 ; 
而 苹果 也 在 逐渐 开放 Siri 的 生态 能 力 ， 在 最 新 的 系统 iOS 12 中 有 
一 项 新 功能 名 为 Shortcuts， 用 户 可 以 通过 Siri 执行 任何 应 用 程序 
的 快速 操作 。 

语音 助手 提供 搜索 第 三 方 应 用 信息 架构 的 功能 ， 将 极 大 提 
高 用 户 的 效率 ， 例 如 在 看 网 易 新 闻 时 唤醒 Siri 说 “打开 微 信 朋 
友 圈 ”， 可 以 立即 打开 微 信 朋 友 圈 ， 比 传统 操作 快捷 很 多 。 其 
实 仅仅 需要 在 系统 和 应 用 层面 进行 小 成 本 的 修改 ， 即 可 实现 该 
功能 ， 改 动 如 下 : 

(1) 功能 /页 面 增加 新 的 标识 /属性 即 可 被 系统 语音 助手 搜索 ， 
本 质 上 也 是 一 种 Deep Link?。 为 了 降低 用 户 的 记忆 成 本 ， 该 功 
能 /页 面 应 该 是 重要 的 、 常 用 的 、 唯 一 的 ， 例 如 可 以 通过 Siri 语 
音 输入 “我 要 和 微 信里 的 莅 志 荣 聊天 ”“ 打 开 微 信 朋 友 圈 ”可 以 





@@ Deep Link， 简 单 点 说 就 是 你 在 手机 上 点 击 一 个 链接 之 后 ， 可 以 直接 链接 到 App 内 
部 的 某 个 页 面 ， 而 不 是 App 正常 打开 时 显示 的 首页 。 
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直接 到 达 相 关 页 面 ， 而 新 闻 、 购 物 等 详情 页 、 聚 合 页 不 应 该 添加 
该 标识 / 属性 。 

(2) 被 语音 助手 调 起 的 页 面 可 以 考虑 将 返回 按钮 直接 改 为 回 
首页 。 由 于 固定 的 信息 架构 使 每 个 页 面 都 能 确定 上 一 级 页 面 是 什 
么 ,流程 为 了 符合 用 户 心理 预期 需要 做 到 “从 哪里 来 回 哪里 去 ”， 
但 语音 调 起 的 功能 /页 面 ， 对 于 用 户 来 说 上 一 级 页 面 是 哪里 无 关 
紧要 ， 可 以 直接 将 返回 上 一 页 改 为 返回 首页 ， 也 方便 用 户 继续 使 
用 该 应 用 。 

(3 ) 被 语音 助手 调 起 的 页 面 有 办 法 直接 回 到 上 一 个 应 用 /页 面 。 
例如 在 iOS 中 调 起 另外 一 个 应 用 时 ， 点 击 屏幕 左上 角 可 以 回 到 原 
应 用 ; 同 理 ， 当 用 户 在 与 微 信 好 友 聊 天 时 ， 使 用 语音 助手 切换 到 
朋友 圈 后 ， 点 击 左 上 角 应 该 还 能 回 到 刚刚 的 聊天 页 面 ， 这 样 可 以 
尽量 避免 打 断 用 户 的 流程 。 以 上 3 点 图 示 如 下 。 


























多 应 用 切换 概念 图 


人 工 智能 的 成 熟 使 语音 助手 得 以 快速 发 展 ， 语 音 助手 与 产品 
信息 架构 的 整合 将 使 每 一 个 功能 都 可 以 被 迅速 访问 ， 产 品 入 口 不 





| 第 4 章 人工 智能 时 代 下 交互 设计 的 改变 | 


再 是 首页 , 语音 助手 给 沉重 的 产品 信息 架构 赋予 了 活力 和 流动 性 。 
该 模式 能 更 好 地 满足 用 户 随心 所 欲 的 需求 ， 也 更 好 地 提高 了 用 户 
的 使 用 效率 。 


4.2.2 流 的 设计 


移动 端 产品 主要 分 为 内 容 〈 资 讯 、 视 频 、 音 乐 等 ) 、 工 具 〔〈 阅 
钟 、 笔 记 、 地 图 等 ) 、 社 交 【〈 聊 天 ) 和 游戏 四 个 方向 。 通 过 不 同 
方向 的 结合 可 以 贱 化 出 不 同 的 产品 ， 人 工 智 能 会 为 这 些 产品 带 来 
怎样 的 变化 ? 我 认为 有 以 下 几 点 。 

(1) 人 工 智能 使 推荐 系统 的 准确 度 大 幅度 提高 ， 用 户 发 现 内 
容 的 成 本 降低 ， 产 品 不 再 需要 复杂 的 架构 来 承载 不 同 内 容 。 

(2) 人 工 智 能 可 以 承担 更 多 复杂 操作 , 工具 的 操作 成 本 降低 ， 
使 用 流程 也 会 随 之 减少 ， 一 款 产 品 只 承担 一 个 工具 不 再 行 得 通 ， 
除非 有 “靠山 ”， 例 如 操作 系统 。 往 年 iOS 和 Android 的 更 新 都 
会 添加 一 些 新 的 工具 功能 ， 加 上 Siri 或 者 Google now 语音 指令 ， 
以 及 负 一 屏 的 信息 聚合 页 面 ， 可 以 使 工具 产品 操作 起 来 更 方便 。 

(3) 基于 对 话 式 的 聊天 社交 已 经 是 最 扁平 的 结构 ， 游 戏 因 复 
杂 而 有 趣 ， 所 以 人 工 智 能 不 应 该 也 不 能 对 它们 进行 简化 ， 但 由 人 
工 智能 驱动 的 VR 和 AR 能 为 社交 和 游戏 产品 带 来 新 的 玩法 和 机 
遇 ， 不 过 不 在 本 次 讨论 中 。 

人 工 智 能 的 驱动 使 内 容 和 工具 型 产品 的 信息 架构 变 得 更 加 扁 
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平 ， 加 上 在 不 同 场景 触发 不 同 功能 ， 有 可 能 实现 “每 个 功能 /页 
面 都 可 能 成 为 用 户 第 一 时 间 触 达 的 功能 /页面 ”， 这 意味 着 每 个 
页 面 都 有 可 能 成 为 首页 ， 都 是 信息 架构 的 顶部 ， 这 需要 产品 的 信 
息 架 构 有 很 强 的 兼容 性 和 扩展 性 。 

拥有 高 兼容 性 和 扩展 性 的 模式 莫 过 于 FEED 和 IM， 这 两 种 结 
构 有 以 下 特点 : 它们 具有 “ 流 ” 的 性 质 ， 结 构 扁平 ， 内 容 可 以 
无 限 延 伸 ，@ 它 们 都 用 样式 相同 的 空 容器 ， 例 如 FEED 的 列表 或 
者 卡片 ，IM 的 气泡 ，@ 空 容器 可 以 承载 各 式 各 样 的 媒体 ， 包 括 文 
字 、 图 片 、 音 频 和 视频 。 

FEED 和 IM 的 区 别 是 是 否 主动 给 予 信息 反馈 。FEED 通过 采 
集 用 户 数据 ， 将 用 户 感 兴趣 的 信息 主动 推荐 给 用 户 ， 在 人 工 智 能 
时 代 下 它 更 适合 用 在 内 容 型 产品 上 。IM 通过 对 话 交流 的 形式 给 出 
问题 或 指令 ， 对 方 根据 相关 内 容 给 予 反馈 ， 在 人 工 智 能 时 代 下 它 
更 适合 用 在 简化 流程 以 及 工具 型 产品 上 。 

既然 固定 内 容 的 概念 被 打破 ， 页 面 可 以 无 限 延伸 ， 为 了 保证 
结构 稳定 和 方便 管理 ， 内 容 和 功能 需要 被 模块 化 。iOS 和 Android 
在 几 年 前 已 采用 了 首页 左 滑 进 入 系统 FEED 的 设计 ， 不 同 产 品 用 
卡片 的 形式 承载 。 小 米 MIUI 9 的 信息 助手 突破 了 产品 间 的 壁垒， 
在 负 一 屏 中 将 不 同 应 用 中 的 同类 别 信息 整理 聚合 , 例如 收藏 支出 、 
快递 、 行 程 、 日 程 等 ， 想 查找 使 用 这 些 信息 时 ， 无 须 进 入 不 同 应 
用 查找 ， 在 信息 助手 中 就 能 快捷 查看 和 使 用 。 


1 一 一 
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iOS、Android 和 MIUI 三 个 操作 系统 的 信息 流 都 采用 了 模块 
化 设计 , 模块 化 设计 可 以 借鉴 原子 设计 的 概念 。 原 子 设计 是 由 原子 、 
分 子 、 生 物体 、 模 板 和 页 面 共 同 协作 以 创造 出 更 有 效 的 用 户 界面 
系统 的 一 种 设计 方法 ， 想 了 解 更 多 内 容 请 搜索 “原子 设计 ”。 


OO® HE ~ 
© 8 
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原子 设计 的 概念 图 
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上 文 提 到 ， 语 音 助手 可 以 触 达 每 个 产品 的 常用 功能 甚至 所 有 
功能 ， 有 助 于 提高 用 户 的 使 用 效率 ; 全 局 性 的 人 工 智能 助手 有 助 
于 整合 信息 、 自 我 学 习 ， 以 提供 更 多 帮助 ， 所 以 未 来 我 们 后 续 的 
产品 需要 在 人 工 智能 助手 的 基础 上 进行 设计 。 人 工 智能 助手 包括 
了 可 以 被 随时 唤醒 的 语音 助手 ， 例 如 Siri， 它 可 以 语音 对 话 和 提 
供 信息 的 展示 ;还 包括 了 操作 系统 层面 的 FEED， 例 如 MIUI 9 的 
信息 助手 ， 它 可 以 主动 展示 相关 内 容 和 入 口 。 








(1) 为 了 方便 用 户 使 用 语音 唤醒 功能 ， 产 品 功 能 应 该 是 可 以 
瞬间 被 理解 的 ， 唤 醒 词 应 该 是 方便 记忆 和 开口 的 ， 例 如 可 以 是 映 
射 到 日 常生 活 中 的 词语 ， 切 勿 使 用 让 人 难以 开口 的 唤醒 词 ， 同 时 
考虑 唤醒 词 的 兼容 性 问题 ， 例 如 不 同方 言 有 着 不 同 叫 法 。 

例如 ,“ 打 开 微 信 朋 友 圈 ”完全 没有 问题 ， 但 “打开 微 信 我 ” 
就 非常 有 问题 , 首先 意思 完全 看 不 懂 , 其 次 用 户 不 会 第 一 时 间 想 到 。 
还 有 考虑 多 种 叫 法 ， 钱 包 在 粤语 里 叫 作 “ 银 包 ”， 意 思 相 同 的 词 
语 应 该 可 以 相互 映射 。 

(2) 聚合 不 同 功能 的 页 面 设计 是 为 了 方便 管理 和 发 现 入 口 ， 
但 本 身 对 用 户 来 说 没有 太 大 意义 。 后 续 请 减少 让 用 户 费 神思 考 和 
记忆 的 聚合 页 面 , 这 样 可 以 避免 被 语音 助手 或 系统 FEED 唤醒 时 ， 
展示 的 全 是 功能 入 口 〈 除 非 这 页 面 便于 用 户 理解 以 及 里 面 的 功能 
非常 重要 ) 。 

例如 ， 微 信 第 三 个 Tab 承载 着 不 同 功能 ， 用 户 可 能 知道 “ 朋 
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友 圈 ”“ 摇 一 摇 ”, 但 可 能 想不到 这 个 聚合 页 面 叫 “ 发 现 ”， 因 为 “发 
现 ” 这 动词 太 抽象 ， 用 户 难 以 第 一 时 间 想 到 。 而 用 户 想到 “钱包 ” 
时 更 多 联想 到 的 是 真实 世界 里 装 钱 的 那个 钱包 ， 但 微 信 的 钱包 功 
能 包括 了 各 种 金融 、O20 服务 , 不 符合 用 户 第 一 时 间 下 的 心理 预期 。 

(3) 不 同 设计 对 象 请 考虑 模块 化 设计 ， 尽 可 能 采用 不 同 入 口 
和 页 面 管理 设计 对 象 ， 方 便 用 户 唤 醒 设计 对 象 。 例 如 ， 设 计 对 象 
有 可 能 是 一 个 功能 ， 也 有 可 能 是 通讯 录 中 的 一 个 名 字 ， 它 们 的 属 
性 和 功能 相同 ， 但 用 户 的 记忆 对 象 不 同 。 

(4) 常用 功能 允许 被 系统 FEED 集成 ， 方 便 用 户 第 一 时 间 使 
用 。 系 统 FEED 也 会 相应 地 提供 入 口 打开 相关 产品 。 

(5) 考虑 避免 常用 功能 与 其 他 功能 的 耦合 ， 降 低 系统 FEED 
的 结构 复杂 性 和 操作 成 本 。 例 如 ， 在 微 信 朋 友 圈 可 以 进入 朋友 的 
详细 资料 并 进行 聊天 , 朋友 圈 和 聊天 两 个 常用 功能 可 以 不 断 循环 ， 
耦合 紧密 会 导致 信息 架构 变 复杂 。 从 产品 和 用 户 角 度 设计 完全 没 
有 问题 ， 但 不 符合 FEED 的 轻 量 结构 。 第 4 点 在 FEED 内 提供 产 
品 入 口 就 是 为 了 在 完全 分 隔 功 能 的 情况 下 做 出 体验 补偿 。 

(6) 具有 操作 性 的 功能 例如 设置 闹钟 、 查 看 天 气 、 购 买 机 票 
等 需要 考虑 页 面 的 信息 展示 和 操作 流程 ， 也 需要 考虑 语音 输入 的 
操作 流程 ， 两 者 的 操作 步骤 在 用 户 认 知 上 需要 统一 。 若 做 不 到 ， 
请 提供 相应 场景 下 的 合理 流程 。 

例如 ， 眼 睛 接收 信息 时 可 以 随处 浏览 ， 它 具有 空间 和 时 间 四 
个 维度 ， 耳 采 接 收 信息 时 只 有 时 间 这 个 维度 ， 会 导致 同时 接收 或 
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者 筛选 的 信息 量具 有 很 大 差异 。 同 理 ， 这 也 是 为 什么 语音 识别 发 
生 错 误 时 ， 用 语音 修正 的 成 本 远 比 用 键盘 修正 的 成 本 大 。 

第 1、2、4 和 6 这 四 点 更 多 考虑 的 是 用 户 在 使 用 语音 或 打开 
App 操作 时 可 能 会 产生 的 不 同心 理 预 期 ， 所 以 需要 保证 设计 对 象 
在 这 两 种 操作 上 的 一 致 性 。 而 第 2、3 和 5 这 三 点 是 从 模块 化 的 角 
度 来 考虑 ， 有 助 于 减少 功能 的 耦合 ， 降 低 信息 架构 的 复杂 程度 。 


4.2.3 下 一 代 人 工 智能 助理 


为 了 更 了 解 用 户 , 人 工 智能 需要 了 解 更 多 数据 ,在 日 常生 活 中 ， 
一 名 用 户 特征 的 主要 信息 归纳 为 身份 信息 、 健 康 数据 、 兴 趣 爱 好 、 
工作 信息 、 财 产 数据 、 信 用 度 、 消 费 信息 、 社 交 轿子、 活动 范围 
9 大 类 。 

(1) 身份 信息 : 姓名、 性别、 年龄、 家乡、 身份 证 (身份 证 
包含 前 4 项 ) 、 账 号 、 现 居住 地 址 和 家 庭 信息 。 

(2) 健康 数据 : 基础 身体 情况 、 医 疗 记录 和 运动 数据 。 

(3) 兴趣 爱好 : 饮食 、 娱 乐 、 运 动 等 方面 。 

(4) 工作 信息 : 公司 、 职 位 、 薪 酬 和 同事 通讯 录 。 

(5) 财产 数据 : 薪酬 、 存 款 、 股 票 、 汽 车 、 不 动产 和 贵重 物品 。 

(6) 信用 度 : 由 信用 机 构 提 供 的 征 信 记录 。 
消费 信息 : 消费 记录 〈 含 商品 类 型 、 购 买 时 间 、 购 买 价 
格 和 收 货 地 址 ) 、 消 费 水 平和 浏览 记录 。 





《7 
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(8) 社交 圈子 : 通讯 录 〈 含 好 友 、 同 事 、 同 学 和 亲 威 ) 和 社 
交 动 态 〈 含 线 下 和 线 上 ) 。 

(9) 活动 范围 : 出 行 记录 、 主 要 活动 范围 和 旅游 足迹 。 

以 上 各 类 信息 都 有 相关 产品 提供 服务 和 数据 记录 ， 例 如 社交 
应 用 微 信 和 陌 隔 、 购 物 应 用 京东 和 淘宝 、 运 动 健康 应 用 Keep 等 。 
如 果 各 方面 数据 打通 并 提供 给 人 工 智 能 ， 人 工 智 能 就 拥有 了 用 户 
更 多 的 数据 和 特征 ， 更 多 应 用 和 智能 硬件 也 可 以 通过 连接 人 工 智 
能 了 解 用 户 信息 ， 从 而 进行 自我 学 习 和 优化 。 总 体 来 说 ， 人 工 智 
能 能 代表 用 户 ， 它 也 是 最 懂 用 户 的 个 人 助理 。 为 了 保证 用 户 数据 
不 被 泄露 ， 以 上 的 用 户 特征 将 以 API 的 形式 接 入 ， 第 三 方 应 用 获 
得 用 户 授权 后 才 可 访问 和 存储 相关 数据 ， 相 关 细 节 请 看 附录 一 “ 面 
向 用 户 的 人 工 智 能 系统 底层 设计 ”。 








4.2.4 新 的 组 件 


除了 用 户 数据 以 API 的 方式 接 入 ， 在 后 续 将 有 更 多 的 组 件 封 
装 好 交 给 开发 者 开发 。 例 如 ，AR 是 人 工 智能 中 机 器 视觉 的 重要 体 
现 ， 具 有 机 器 视觉 能 力 的 摄像 模块 可 以 将 电子 世界 和 现实 世界 结 
合 得 更 紧密 ， 第 三 方 应 用 接 入 摄像 模块 可 以 有 更 多 玩法 。 

语音 识别 是 人 工 智能 中 自然 语言 的 重要 体现 ， 第 三 方 应 用 接 
入 系统 语音 模块 可 以 优化 自己 的 产品 结构 , 提高 用 户 的 操作 效率 。 

身份 验证 模块 类 似 于 现在 的 Oauth 协议 ， 方 便 用 户 注 册 和 登 
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录 第 三 方 应 用 。 身 份 信 息 API 提供 的 公开 信息 减少 了 用 户 注册 时 
的 信息 填写 成 本 , 也 有 利于 第 三 方 应 用 获取 更 完整 .更 正确 的 信息 。 
应 用 注册 需要 个 人 身份 信息 已 在 国内 实现 , 只 不 过 是 由 国家 规定 ， 
第 三 方 应 用 注册 时 要 求 绑 定 手机 号 码 ， 而 手机 号 码 已 与 个 人 身份 
信息 挂钩。 

由 于 银行 想法 和 技术 的 滞后 ， 给 予 国内 第 三 方 公司 如 阿里 支 
付 宝 、 腾 讯 财 付 通 等 创造 移动 支付 的 机 会 ， 苹果 、Google 在 iOS 
和 Android 系统 层面 推出 了 自己 的 移动 支付 方式 。 但 是 多 种 支付 
手段 都 不 利于 个 人 账单 管理 ， 在 使 用 流程 上 微 信 、 支 付 宝 等 扫 二 
维 码 的 手段 都 不 如 系统 层级 使 用 NFC 的 Apple Pay 方便 。 要 统一 
支付 流程 ， 必 须 由 国家 机 构 推 出 新 的 政策 来 执行 了 ， 统 一 的 支付 模 
块 有 助 于 用 户 移动 支付 和 个 人 账单 管理 。 





4.2.5 ”手机 的 新 形态 


在 中 国有 一 家 名 叫 “ 柔 宇 科技 ”的 公司 在 柔性 屏幕 上 已 经 积 
累 了 数 干 件 知识 产权 与 专 有 技术 ， 它 在 2014 年 全 球 第 一 个 发 布 了 
国际 业界 最 薄 、 厚 度 仅 为 0.01 毫米 的 全 彩 AMOLED 柔性 显示 屏 ， 
几乎 是 头发 丝 的 115， 而 且 在 弯 折 10 万 次 后 依然 可 以 实现 高 质量 





@ 央行 已 宣布 从 2018 年 6 月 30 日 起 ， 类 似 支付 宝 、 财 付 通 等 第 三 方 支付 公司 受理 的 、 
涉及 银行 账户 的 网 络 支付 业务 ， 都 必须 通过 “网 联 支付 平台 ”处 理 。 同 时 ， 国 家 已 
关注 人 工 智能 服务 社会 信用 体系 的 建设 工作 ， 腾 讯 也 开始 建设 自家 信用 体系 ， 在 不 
久 的 将 来 相信 个 人 征 信也 会 被 国家 机 构 统一 。 





























142 一 一 


| 第 4 章 人工 智能 时 代 下 交互 设计 的 改变 | 





的 显示 效果 。 在 2018 年 ， 柔 宇 科技 的 柔性 屏 已 经 发 展 到 第 六 代 。 
此 外 ， 三 星 计划 在 2019 年 推出 代号 为 Winner 的 Galaxy 可 折 琶 智 
能 手机 ， 一 款 7 英寸 柔性 屏幕 的 手机 设备 能 折 又 到 钱包 大 小 。 同 
时 美国 专利 商标 局 向 苹果 公司 授予 了 一 项 名 为 “配置 可 折 芭 屏幕 
电子 设备 ”的 专利 ， 我 们 可 以 想象 ， 在 未 来 数 年 内 ， 随 处 都 能 看 
到 人 们 在 用 可 折 又 手机 。 

柔性 显示 技术 将 革命 性 地 改变 消费 电子 产品 的 现 有 形态 ， 相 
比 传统 的 显示 屏 技 术 ， 柔 性 屏幕 显示 具有 众多 优点 ， 例 如 轻薄 、 
可 卷曲 、 可 折 又 、 便 携 、 不 易 碎 等 。 柔 性 屏 短期 内 可 能 对 智能 手 
机 产生 根本 性 的 颠覆 ， 它 比 现在 的 硬 屏 手 机 有 更 多 的 交互 方式 ， 
长 期 甚至 可 能 改变 智能 家 居 的 产业 格局 ， 它 会 对 未 来 的 人 机 交互 
方式 带 来 深远 的 影响 。 








通过 弯曲 屏幕 模拟 翻 书 效果 
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在 未 来 ， 手 机 屏幕 将 变 得 更 大 ， 展 开 时 它 可 能 会 达到 平板 计 
算 机 大 小 ， 有 更 多 的 显示 空间 展示 内 容 ， 同 时 我 们 设计 时 也 要 考 
虑 折 芭 时 信息 的 展现 。 柔 性 屏幕 还 可 以 弯曲 成 手 环 的 形状 ， 直接 
戴 在 手 上 。 当 手机 可 以 在 手 环 、 手 机 、 平 板 三 个 状态 灵活 切换 时 ， 
我 们 需要 考虑 这 三 种 状态 对 用 户 来 说 意味 着 什么 ， 同 时 也 要 考虑 
如 何在 可 变化 、 更 有 效 的 利用 空间 内 展示 内 容 ， 切 换 状态 时 不 同 
组 件 的 过 渡 动 效 也 将 成 为 交互 和 视觉 的 难点 。 








柔性 屏 手 机 概念 图 


4.3 三维 空间 下 的 交互 设计 


二 维 平面 的 交互 是 人 为 设 定 的 ， 情 景 几 乎 是 不 会 发 生变 化 的 ; 
而 人 所 在 的 三 维 空间 很 复杂 ， 情 景 也 会 随 着 人 与 任意 对 象 之 间 的 
任务 而 发 生变 化 ， 同 时 交互 的 方式 也 会 根据 当前 情景 发 生变 化 。 
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举 一 个 简单 的 例子 ， 假 设 我 们 有 一 副 来 自 未 来 的 AR 眼镜 ， 当 我 
们 在 日 常 工作 中 会 随时 走 来 走 去 ，AR 眼镜 反馈 给 我 们 的 内 容 应 该 
根据 环境 、 视 线 焦点 、 当 前 任务 等 条 件 进 行动 态 变化 ， 这 时 候 我 
们 可 以 通过 手势 、 语 音 等 多 种 方式 与 内 容 进行 交互 ; 而 我 们 使 用 
手机 时 ， 每 次 打开 都 是 相同 的 页 面 。 三 维 空间 下 的 交互 远 比 二 维 
平面 的 交互 复杂 ， 以 下 分 析 一 下 三 维 空间 的 交互 设计 需要 注意 哪 
些 事项 。 














4.3.1 三 维 空间 交互 设计 的 共通 点 


用 户 在 三 维 空间 下 的 主要 交互 对 象 可 以 分 为 虚拟 界面 和 真实 
物体 两 大 类 ， 虚 拟 界面 包括 VR、AR 和 MR (下 文 统 称 XR) ， 
真实 物体 则 为 各 种 智能 硬件 ， 我 认为 它们 的 设计 共通 点 主要 有 三 
点 : @ 考 虑 多 模 态 交互 ;， @) 根 据 空 间 定 位 做 出 响应 ，@@ 考 虑 情境 


1) 考虑 多 模 态 交互 

在 第 一 节 已 经 提 到 人 类 应 该 可 以 通过 多 种 交互 方式 直观 地 与 
计算 机 进行 交互 ， 而 且 已 经 对 各 种 感官 以 及 交互 方式 有 所 解释 。 
在 三 维 空间 下 ， 最 主要 的 交互 方式 是 语音 交互 以 及 基于 体态 语言 
理解 的 交互 。 语 音 交 互 可 以 突破 距离 的 限制 进行 远程 操作 ， 同 时 
它 也 是 绝 大 部 分 用 户 都 懂 的 互动 方式 。 体 态 语言 理解 是 人 机 交互 
领域 中 的 核心 技术 ， 包 括 肢 体 语言 及 空间 语言 ， 肢 体 语 言 的 相关 


内 容 请 看 回 第 一 节 ， 空 间 语言 请 看 下 一 点 。 
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2) 根据 空间 定位 做 出 响应 
空间 语言 指 的 是 社会 场合 中 人 与 人 身体 之 间 所 保持 的 距离 间 
隔 。 空 间 语言 是 无 声 的 ,但 它 对 人 际 交往 具有 潜在 的 影响 和 作用 。 
美国 人 类 学 家 爱德华 替 尔 (Edward Hall) 在 经 典 著作 《 近 体 行 
为 的 符号 体系 》 中 将 人 类 的 空间 区 域 距离 分 为 : 亲密 距离 、 个 人 
距离 、 社 交 距 离 以 及 公共 距离 ， 以 下 是 来 自 百度 百科 的 解释 : 
。 亲密 距离 (0 ~ 46 厘米 ) : 其 语义 为 “亲切 、 热 烈 、 亲 密 ”， 
在 这 个 距离 内 可 以 感受 到 对 方 的 体 热 和 气味 ， 沟 通 更 多 依 
赖 触 觉 。 在 通常 情况 下 ， 只 人 允许 父母 、 夫 妻 、 情 但 或 孩子 
进入 这 一 范围 。 其 中 0 ~ 15 厘米 为 近 位 亲密 距离 ， 常 用 于 
恋人 和 夫妻 之 间 ， 表 达 亲 密 无 间 的 感情 色彩 ，16 ~ 46 厘米 
为 远 位 亲密 距离 , 是 父母 与 子女 、 兄 弟 、 姐 妹 间 的 交往 距离 。 
。 个 人 距离 〈46 ~ 120 厘米 ) : 其 语义 为 “亲切 、 友 好 ”。 
这 种 距离 是 朋友 之 间 沟 通 的 适当 距离 ， 如 鸡尾酒 会 、 友 谊 
聚会 或 派对 中 的 人 际 距离 。 其 中 46 ~ 75 厘米 为 近 位 个 人 
区 域 ， 在 这 一 区 域 人 们 可 以 保持 正常 视觉 沟通 ， 又 可 以 相互 
握手 。 陌 生 人 进入 这 个 距离 会 构成 对 别人 的 侵犯 ，76 ~ 120 
厘米 为 远 位 个 人 区 域 ， 熟 人 和 陌生 人 都 可 以 进入 这 一 区 域 。 
。 社交 距离 (1.2 ~ 3.6 米 ) : 其 语义 为 “严肃 、 庄 重 ”。 这 
种 距离 的 沟通 不 带 有 任何 个 人 情感 色彩 ， 用 于 正式 的 社交 
场合 。 在 这 个 距离 内 沟通 需要 提高 谈话 的 音量 ， 需 要 更 充 
分 的 目光 接触 。 如 政府 官员 向 下 属 传达 指示 、 单 位 领导 接 
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待 来 访 者 等 ， 都 往往 处 于 这 一 距离 范围 内 ， 适 合 于 社交 活 
动 和 办 公 环 境 中 处 理 业 务 等 。 

公共 距离 〈3.6 米 以 上 ) : 其 语义 为 “自由 、 开 放 ”。 这 
是 人 们 在 较 大 的 公共 场所 保持 的 距离 ， 是 一 切 人 都 可 以 自 
由 出 入 的 空间 距离 。 


在 未 来 用 户 周围 一 定 有 很 多 可 交互 的 设备 ， 如 果 全 部 的 设备 
经 常 与 用 户 互动 ， 我 们 可 以 想象 被 一 群 吵吵 喷 嘻 的 孩子 包围 的 感 


=] 
觉 是 怎 


/EN 


样 的 。 因 此 我 们 设计 的 任意 对 象 应 该 根据 用 户 与 设计 对 象 


处 于 社交 距离 以 及 公共 距离 (大 于 120 厘米 ) 时 设计 对 象 
应 该 保持 沉默 状态 。 

处 于 远 位 亲密 距离 以 及 个 人 距离 〈16 ~ 120 厘米 ) 时 设计 
对 象 应 该 处 于 已 激活 状态 ， 随 时 可 以 与 用 户 进行 交互 ， 同 
时 可 以 考虑 适当 地 主动 与 用 户 进行 交互 ， 例 如 主动 展示 信 
息 以 及 打招呼 。 

处 于 近 位 亲密 距离 〈0 ~ 15 厘米 ) 时 候 设 计 对 象 与 用 户 之 
间 的 信息 交换 应 该 是 毫 无 保留 的 ， 还 有 设计 对 象 主 动 与 用 
户 交 互 的 次 数 可 以 考虑 适当 增加 。 

若 有 紧急 状况 或 者 用 户 定制 的 信息 需要 提醒 用 户 ， 可 忽略 
距离 限制 及 时 告知 用 户 。 若 距离 过 远 请 考虑 最 合适 的 方式 
通知 用 户 。 
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目前 我 们 主要 用 到 的 空间 定位 技术 有 SLAM (Simultaneous 
Localization and Mapping, 即时 定位 与 地 图 构建 ) 和 6 DOF (Degree 
of Freedom， 自 由 度 ) 。SLAM 主要 用 在 智能 机 器 人 上 。 机 器 人 
可 以 在 未 知 环境 中 从 一 个 未 知 位 置 开 始 移动 ， 在 移动 过 程 中 根据 
位 置 估计 和 地 图 进行 自身 定位 ， 同 时 在 自身 定位 的 基础 上 建造 增 
量 式 地 图 , 实现 机 器 人 的 自主 定位 和 导航 。6 DOF 主要 用 在 XR 上 ， 
它 能 映射 出 用 户 在 现实 世界 中 是 如 何 移动 的 。6 DOF 分 成 两 种 不 
同 的 类 型 ; 平移 运动 和 旋转 运动 ， 任 何 运动 都 可 以 通过 6 DOF 的 
组 合 进 行 表 达 。 

3) 考虑 情境 理解 

用 户 同样 的 输入 ， 在 不 同 的 情境 下 可 能 会 有 不 同 的 意图 ; 当 
用 户 操作 的 环境 是 在 三 维 空间 时 ， 随 着 操作 对 象 不 断 变 化 ， 用 户 
的 操作 和 意图 会 更 加 复杂 而 且 发 生动 态 变化 ， 使 情境 的 动态 性 问 
题 更 加 突出 。 设 计 对 象 之 间 的 数据 互通 能 更 好 地 分 享用 户 在 不 同 
设计 对 象 上 的 操作 和 意图 ， 实 现 更 好 的 情境 理解 。 


4.3.2 ”虚拟 界面 


1) 建立 规则 

在 面 对 一 个 全 新 的 事物 时 ， 人 们 更 希望 能 将 它 和 熟悉 的 事物 
进行 对 比 来 获取 认 知 ， 这 也 是 为 什么 早期 GUI 的 设计 会 参考 这 么 
多 现实 中 的 真实 事物 ， 包 括 它 们 的 样式 以 及 交互 方式 。 在 构建 丰 
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富 的 虚拟 现实 体验 时 ， 为 了 让 用 户 更 容易 沉浸 在 我 们 所 设想 的 现 
实 之 中 ， 应 该 一 开始 就 要 快速 向 用 户 讲解 这 个 世界 的 规则 ， 例 如 
这 里 的 重力 、 摩 擦 力 、 惯性 等 物理 因素 是 否 与 我 们 所 认 知 的 一 样 ， 
这 是 充满 兽人 与 黑暗 魔法 师 的 世界 还 是 1888 年 开膛 手 杰 克 四 处 杀 
人 的 伦敦 东区 …… 如 果 存 在 魔法 ， 说 不 定 用 户 就 能 吟唱 咒语 使 用 
魔法 ; 如 果 有 杀人 凶手 ， 说 不 定 用 户 就 是 可 击毙 他 的 探 长 ， 拥 有 
杰出 的 射击 能 力 。 

在 创建 AR 或 MR 体验 时 ， 我 们 的 主要 目标 几乎 与 VR 完全 相 
反 。 在 AR 和 MR 中 ， 我 们 的 重点 是 把 内 容 带 到 现实 世界 ， 让 它 和 
我 们 的 现实 世界 一 样 ， 但 是 可 以 为 用 户 带 来 神奇 的 感受 。 需 要 注意 
的 是 ， 你 遵循 的 现实 规则 越 多 ， 体 验 看 上 去 就 越 扎 根 于 现实 ， 这 样 
用 户 才能 预期 即将 出 现 哪 种 交互 方式 , 以 及 用 户 界面 存在 哪 种 选项 。 

2) 用 正确 的 元 素 构建 适合 的 世界 

不 同 世 界 有 着 不 同 的 风格 和 材料 设计 ， 以 下 几 点 都 是 设计 时 
必须 考虑 的 : 

(1) 光线 : 现实 世界 中 总 是 充满 光影 ， 阴 影 是 影响 用 户 感受 
到 的 视觉 真实 性 的 重要 因素 之 一 。 有 研究 指出 ， 在 虚拟 场景 中 使 
用 动态 移动 的 阴影 ， 要 比 使 用 静态 阴影 或 者 没有 阴影 能 引发 更 强 
的 临 境 感 。 微 软 的 Fluent Design 认为 光线 是 一 种 轻 量 、 合 理 、 能 
够 给 用 户 提供 邀请 的 交互 方式 ， 而 Material Design 通过 光线 引入 
了 阴影 ， 它 们 都 希望 把 自己 的 设计 语言 立意 在 大 自然 的 基础 上 ， 
从 而 更 贴近 人 们 的 生活 。 
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(2) 声音 : 声音 对 临 境 感 有 很 大 的 影响 。 有 研究 表明 ， 与 没 
有 特定 方位 的 声音 或 没有 声音 相 比 ， 有 特定 方位 的 声音 会 增强 用 
户 的 临 境 感 ， 另 外 ， 在 虚拟 场景 中 与 视觉 信息 同步 的 声音 可 以 提 
高 用 户 的 自我 运动 感 ， 而 这 种 自我 运动 感 的 提升 也 有 助 于 增强 临 
境 感 。 

(3) 触觉 反馈 : 触觉 反馈 对 提升 临 境 感 的 作用 非常 明显 ， 尤 
其 是 触 碰 到 物体 时 如 果 缺 乏 触感 会 让 大 脑 感 到 困惑 ， 现 在 许多 企 
业 与 研究 机 构 非常 重视 触觉 模拟 的 研发 ， 也 正 是 看 到 了 触觉 模拟 
对 于 提升 临 境 感 的 重要 性 。 

(4) 运动 设计 : 运动 设计 对 于 XR 的 UI 表现 和 交互 体验 来 说 
都 是 至 关 重 要 的 一 环 。 我 们 可 以 想象 一 下 电影 中 的 运动 设计 ， 运 
动 的 无 缝 过 渡 让 你 能 够 专注 于 故事 ， 为 你 带 来 真实 体验 。 可 以 将 
这 些 感觉 融入 设计 ， 引 导 人 们 在 观 影 过 程 中 轻松 从 一 个 任务 跳 转 
到 另 一 个 任务 。 

3) 考虑 合适 的 环顾 方式 

由 于 “眼镜 、 手 机 ”组 合 的 低 端 VR 设备 不 具备 检测 用 户 身 
体位 移 的 能 力 ， 所 以 在 使 用 过 程 中 用 户 很 少 需要 发 生 位 移 ， 此 外 ， 
360” 全 景 视频 的 拍摄 也 是 以 一 点 为 中 心 拍 摄 其 周围 360” 的 影 
像 ， 在 观看 时 ， 用 户 是 处 于 摄像 机 的 位 置 对 周围 进行 观察 ， 所 以 
以 用 户 为 中 心 环顾 视角 的 方式 被 多 数 VR 产品 使 用 。 但 是 ， 当 用 
户 细致 观察 某 件 物品 时 ， 是 以 它 为 中 心 环 顾 的 方式 来 观看 的 ， 因 
此 我 们 也 要 兼顾 以 物体 为 中 心 环顾 的 方式 来 设计 整个 XR 产品 。 
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4) 考虑 合适 的 阅读 距离 
很 多 事情 会 影响 界面 的 可 读 性 ， 例 如 字体 的 大 小 、 对 比 度 、 
间距 等 ， 在 XR 中 会 增加 另外 一 个 因素 : 深度 。 深 度 是 微软 Fluent 
Design 中 最 重要 的 内 容 。 深 度 不 仅 可 以 表现 UI 元 素 的 层次 及 重 
要 程度 ， 更 可 以 表现 虚拟 物体 在 3D 空间 中 的 方位 ， 例 如 相同 的 
物体 显示 大 小 不 一 样 ， 我 们 可 以 知道 哪 一 个 离 我 们 更 近 。 因 此 我 
们 应 该 将 深度 融入 虚拟 界面 中 ， 将 平面 的 二 维 界面 转化 为 能 创建 
视觉 层次 、 更 丰富 、 更 有 效 呈 现 信息 和 概念 的 界面 。 
以 下 是 Google VR 设计 团队 在 Cardboard Design Lab 中 总 结 
的 有 关 阅 读 距 离 的 经 验 : 
。 0.5 米 : 当 文 本 离 你 太 近 时 会 让 眼睛 很 难 聚焦 ， 尤 其 是 在 
近 焦 平面 和 远 焦 平面 之 间 移 动 时 。 
。 1.0 米 : 这 是 维持 界面 良好 可 读 性 的 最 近 距 离 ， 但 是 时 间 
一 长 ， 这 么 近 的 文本 仍然 会 引起 眼睛 疲劳 。 
。 1.5 米 : 文本 可 以 被 舒适 地 阅读 ， 但 是 在 远近 之 间 切 换 焦 
点 还 是 可 能 引起 眼睛 的 疲劳 。 
。 2.0 米 : 当 文 本 再 远 一 点 ， 立 体 的 效果 就 会 减少 ， 但 这 有 
助 于 减少 眼睛 的 疲劳 。 从 2 米 开 始 , 对 象 更 容易 被 聚焦 (最 
终 的 阅读 效果 要 看 使 用 哪 种 VR 镜片 ) 。 
。 3.0 米 : 这 是 较 好 的 界面 显示 距离 ， 它 阅读 起 来 不 仅 清 晰 
舒服 ， 而 且 不 会 干扰 大 多 数 场景 。 
。 6.0 米 : 更 远 的 距离 保持 界面 的 可 读 性 也 是 有 可 能 的 ， 但 
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是 距离 靠 前 的 物体 可 能 会 遮挡 到 界面 从 而 降低 文本 的 可 读 
性 ， 如 果 不 遮挡 又 可 能 会 让 用 户 觉得 有 点 怪 。 
而 在 微软 的 Mixed Reality 设计 规范 中 ， 推 荐 界面 的 显示 区 域 
介 于 1.25 米 和 5 米 之 间 。2 米 是 最 理想 的 显示 距离 。 当 显示 距离 
越 接 近 1 米 ， 在 z 轴 上 经 常 移动 的 界面 比 静 止 的 界面 更 容易 出 现 
问题 。 


Optimal zone 
1deal hologram pbeemenr 





微软 Mixed Reality 对 于 界面 距离 显示 的 观点 


切记 ， 以 上 观点 只 适用 于 头 戴 显示 器 ， 不 一 定 适用 于 手机 上 
的 AR 产品 。 

5) 考虑 凝视 交互 

头 部 追踪 将 为 头 戴 设 备 提供 新 的 输入 方式 。 用 户 可 以 通过 旋 
转 头 部 以 及 凝视 某 个 物体 的 方式 告知 应 用 程序 他 们 的 意图 和 兴趣 
点 是 什么 ， 类 似 于 PC 时 代 的 光标 定位 。 在 XR 中 ， 我 们 可 以 考虑 
在 屏幕 中 间 放 置 一 个 固定 焦点 来 做 视觉 辅助 ， 这 样 有 助 于 用 户 知 
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道 哪个 物体 正在 你 的 视觉 中 心 上 。 同 时 我 们 应 该 将 凝视 交互 用 于 
附近 或 者 大 型 对 象 上 ， 因 为 用 户 尝试 将 焦点 聚焦 在 一 个 遥远 或 者 
小 型 对 象 上 ， 需 要 头 部 做 出 精细 且 不 自然 的 运动 ， 会 让 用 户 感 觉 
很 痛苦 〈 类 似 于 GUI 里 的 费 茨 定律 ) 。 

上 文 提 及 通过 焦点 可 以 突破 空间 的 距离 而 发 生 交互 ， 我 觉得 
通过 这 种 交互 方式 可 以 实现 很 多 有 趣 的 玩法 ， 例 如 凝视 某 个 位 置 
就 能 闪现 到 那个 位 置 上 ， 或 者 手指 向 某 个 物体 就 能 把 这 个 物体 吸 
过 来 ， 这 些 在 魔幻 电影 或 者 游戏 中 才能 看 到 的 画面 ， 都 可 以 在 虚 
拟 世 界 中 轻而易举 地 做 到 。 在 XR 中 ， 只 有 你 想不到 ， 没 有 做 不 
到 。 关 于 XR 相关 的 更 多 设计 内 容 ， 可 以 参考 微软 提出 的 Fluent 
Design、Mixed Reality 设计 规范 和 Google 的 官方 AR 设计 指南 ， 
这 应 该 是 2018 年 9 月 前 最 为 全 面 的 设计 规范 了 。 


4.3.3 ”智能 硬件 


如 果 说 XR 在 未 来 一 段 时 间 内 都 需要 用 户主 动 使 用 才能 工作 ， 
那么 你 的 产品 设计 可 以 天 马 行 空 (因为 目前 AR 和 MR 还 没 研发 
出 用 户 可 以 经 常 穿戴 的 产品 ， 用 户 不 会 经 常 携带 ) 。 但 是 智能 硬 
件 是 绝对 不 行 的 ， 因 为 智能 硬件 需要 存活 在 用 户 生活 中 。 用 户主 
动 和 设备 交互 的 时 间 和 次 数 相对 较 少 ， 那 么 用 户 不 主动 发 起 交流 
时 设备 该 干 嘛 呢 ? 可 能 大 家 会 想 ， 如 果 用 户 不 注意 到 产品 ， 那 怎 
么 记得 使 用 产品 呢 ? 我 认为 这 是 非常 危险 的 想法 。 如 果 每 个 智能 
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硬件 都 在 用 户 周 围 员 员 嘻 哮 ， 用 户 的 生活 怎么 过 ? 因此 我 的 见解 
是 不 应 该 经 常 打扰 用 户 ， 产 品 只 需要 安静 地 提供 服务 就 好 了 。 

“安静 地 提供 服务 ”是 一 个 既 矛 盾 又 合理 的 答案 。 矛 盾 的 地 方 
在 于 当 产 品 提供 服务 的 时 候 用 户 必 定 能 感知 到 ， 这 时 候 其 实 已 经 
打扰 到 用 户 了 ; 合理 的 地 方 在 于 如 果 每 次 用 户 使 用 产品 时 都 需要 
走 到 设备 跟前 操作 ， 那 么 这 款 产 品 一 点 都 不 智能 。 

要 实现 “安静 地 提供 服务 ”， 主 要 的 解决 思路 其 实 就 是 我 们 
熟知 的 场景 化 设计 。 前 面 提 到 的 “通过 用 户 的 空间 定位 来 做 出 响应 ” 
观点 也 属于 场景 化 设计 之 一 。 除 了 空间 定位 外 ,还 可 以 通过 时 间 、 
触发 事件 来 做 场景 化 设计 。 以 白领 用 户 为 例 ， 工 作 日 用 户 在 家 使 
用 设备 的 时 间 可 以 分 为 起 床 后 至 出 门 前 ， 以 及 下 班 后 至 睡觉 前 这 
两 段 时 间 ， 但 里 面 还 有 很 多 细节 可 以 考虑 : 

(1) 快 到 闹钟 响起 的 时 候 ， 设 备 能 提供 什么 服务 ? 

(2) 用 户 醒 后 睡意 腊 胱 ， 这 时 候 设 备 能 提供 什么 服务 ? 

(3) 用 户 洗 濑 、 穿 衣 和 吃 早餐 的 时 间 内 ,设备 能 提供 什么 服务 ? 

(4) 用 户 出 门 前 设备 能 提供 什么 服务 ? 

在 不 同 的 时 间 段 内 ， 用 户 的 行为 会 发 生 不 同 的 变化 ， 这 时 候 
产品 服务 是 否 需要 根据 用 户 行为 做 出 变化 ?这样 用 户 可 以 随时 “ 临 
幸 ” 产 品 ， 都 不 需要 过 多 的 操作 而 且 用 完 即 走 。 

除了 场景 化 设计 外 ， 为 了 更 好 地 做 到 “安静 地 服务 用 户 ”， 
我 们 要 考虑 待机 情况 下 的 几 点 细节 : 





154 一 一 


| 第 4 章 人工 智能 时 代 下 交互 设计 的 改变 | 


(1) 设备 待机 时 是 否 耗 电 ? 

(2) 设备 待机 时 可 以 关闭 哪些 器 件 ? 

(3) 设备 待机 时 风扇 声 等 噪音 是 否 会 影响 到 用 户 ? 

(4) 用 户 突然 把 家 里 电源 关 掉 并 重启 后 , 设备 是 否 自动 重启 ? 

(5) 用 户 在 重新 启动 设备 时 是 否 很 麻烦 ， 甚 至 会 有 安全 问题 ? 

第 1、2、3 点 直接 影响 到 用 户 是 否 愿意 让 设备 长 时 间 处 于 待 
机 状态 ; 第 4 点 直接 影响 到 设备 能 否 自行 地 长 时 间 运 行 ， 因 为 用 
户 很 有 可 能 会 随时 把 电源 关 掉 ， 第 5 点 看 起 来 有 点 搞笑 ， 但 这 是 
整个 产品 设计 的 大 前 提 ， 例 如 有 些 设备 需要 安装 在 天 花 板 上 ， 会 
导致 用 户 需 要 经 常人 梯子 上 去 打开 设备 ， 这 时 候 会 有 安全 上 的 风 
险 。 以 上 几 点 能 直接 影响 到 硬件 的 电路 设计 ， 如 果 考 虑 不 周全 ， 
最 后 的 结果 就 是 产品 会 被 用 户 经 常 关闭 ， 可 交互 的 次 数 大 幅度 减 
少 。 同 时 硬件 上 的 问题 也 会 直接 影响 每 个 功能 的 设计 ， 最 终 也 会 
影响 产品 如 何 与 用 户 进行 交互 。 

未 来 应 该 会 出 现 更 多 多 功能 合 一 的 产品 ， 这 时 候 要 考虑 每 个 
功能 的 属性 、 使 用 频率 以 及 使 用 时 长 等 问题 ， 这 些 因素 也 会 导致 
产品 如 何 与 用 户 进行 交互 。 以 智能 音箱 和 卧室 灯 结 合 为 例子 : 智 
能 音箱 默认 是 长 时 间 打 开 ， 随 唤 随 用 的 产品 ， 而 卧室 灯 的 使 用 频 
率 和 时 长 是 由 用 户 生 活 习惯 决定 的 ， 有 些 用 户 出 了 房间 后 可 能 会 
随时 关 灯 ， 这 时 候 会 直接 导致 共用 同一 条 电线 的 智能 音箱 断 电 而 
无 法 使 用 ， 智 能 音箱 随 唤 随 用 的 特点 也 会 随 之 消失 ， 同 时 很 有 可 
能 每 次 用 户 开 灯 时 ， 智 能 音箱 的 启动 声音 会 吓 用 户 一 跳 ， 导 致 整 
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个 产品 体验 起 来 会 非常 怪异 。 

关于 智能 硬件 的 交互 设计 知识 还 有 很 多 很 多 ， 在 此 就 不 一 一 
列举 了 。 最 后 ， 当 生活 中 充斥 着 各 种 智能 硬件 时 ， 我 们 应 该 考虑 
和 多 方 厂商 进行 合作 ， 为 用 户 带 来 更 优质 的 生活 体验 。 同 时 生活 
中 的 点 点 滴 滴 都 可 能 对 一 个 人 造成 潜移默化 的 影响 ， 因 此 我 们 也 
需要 考虑 产品 是 否 会 给 用 户 的 生活 以 及 周围 的 亲人 尤其 小 孩 带 来 
影响 ， 毕 竟 生 活 和 亲人 才 是 最 重要 的 。 





4.4 话音 交互 设计 


对 话 是 人 与 人 之 间 交 换 信息 的 普遍 方式 。 人 可 以 在 交流 时 通 
过 判别 对 方 的 语气 、 眼 神 和 表情 判断 对 方 表达 的 情感 ， 以 及 根据 
自身 的 语言 、 文 化 、 经 验 和 能 力 理解 对 方 所 发 出 的 信息 ， 但 对 于 
只 有 0 (false) 和 1 (true〉 的 计算 机 来 讲 ， 理 解 人 的 对 话 是 一 件 
非常 困难 的 事情 ， 因 为 计算 机 不 具备 以 上 能 力 ， 所 以 目前 的 语音 
交互 主要 由 人 来 设计 。 有 人 觉得 语音 交互 就 是 设计 怎么 问 怎么 答 ， 
看 似 很 简单 也 很 无 聊 ， 但 其 实 语音 交互 设计 涉及 系统 学 、 语 言 学 
和 心理 学 ， 因 此 它 比 GUI 的 交互 设计 更 加 复杂 。 

要 做 好 一 个 语音 交互 设计 ， 首 先 要 知道 自己 的 产品 主要 服 
务 对 象 是 谁 ? 单 人 还 是 多 人 使 用 ? 第 二 ， 要 对 即将 使 用 的 语音 智 
能 平台 非常 了 解 ， 第 三 ， 要 考虑 清楚 自己 设计 的 产品 使 用 在 哪 ， 
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纯 语音 音箱 还 是 带 屏幕 的 语音 设备 ?了解 完 以 上 三 点 ， 你 才能 
更 好 地 去 设计 一 款 语音 产品 。 考 虑 到 目前 市 场 上 Alexa、Google 
Assistant、DuerOS、AliGenie 等 语音 智能 平台 都 有 各 自 的 优 缺 点 ， 
以 下 讲述 的 语音 交互 设计 将 是 通用 的 、 抽 象 的， 不 会 针对 任意 一 


款 语音 智能 平台 。 


4.4.1 语音 交互 相关 术语 


在 设计 语言 交互 之 前 ， 我 们 先 了 解 一 下 与 语音 交互 相关 的 
术语 : 

技能 (Skill) : 技能 可 以 简单 理解 为 一 个 应 用 。 当 用 户 说 
“Alexam， 我 要 看 新 闻 ”或 者 说 “Alexa， 我 要 在 京东 上 买 东西 ” 
时 ， 用 户 将 分 别 打开 新 闻 和 京东 购物 两 项 技能 ， 而 “新 闻 ” 和 “ 京 
东 ” 两 个 词 都 属于 触发 该 技能 的 关键 词 , 也 就 是 打开 该 应 用 的 入 口 ， 
后 面 用 户 说 的 话 都 会 优先 匹配 该 项 技能 里 面 的 意图 。 由 于 用 户 呼 
喊 触发 词 会 加 深 用 户 对 该 品牌 的 记忆 ， 因 此 触发 词 具 有 很 高 的 商 
业 价 值 。 

意图 (Intent) : 意图 可 以 简单 理解 为 某 个 应 用 的 功能 或 者 
流程 , 主要 满足 用 户 的 请 求 或 目的 。 意图 是 多 句 表达 形式 的 集合 ， 








@ “Alexa” 是 唤醒 语音 设备 的 唤醒 词 ， 相 当 于 手机 的 解锁 页 面 ， 同 时 也 是 便捷 回 到 
首页 的 home 键 。 目 前 的 语音 设备 需要 被 唤醒 才能 执行 相关 操作 ， 例 如 “Alexa， 现 
在 几 点 ? ”“Alexa, 帮 有 我 设置 一 个 闹钟 ”。 这 样 设计 的 好 处 是 省 电 以 及 保护 用 户 隐私 ， 
避免 设备 长 时 间 录 音 。 
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例如 “我 要 看 电影 ”和 “我 想 看 2001 年 刘德华 拍摄 的 动作 电影 ” 
两 种 表达 方式 都 可 以 属于 同一 个 视频 播放 的 意图 ， 只 是 表达 方式 
不 一 样 。 意 图 要 隶属 于 某 项 技能 ， 例 如 “京东 ， 我 要 买 巧 克 力 ” 
这 个 案例 ,“ 我 要 买 巧克力 ”这 个 意图 是 属于 “京东 ”这 个 技能 的 。 
而 当 用 户 只 说 “Alexa， 我 要 买 巧克力 ”， 如 果 系 统 不 知道 这 项 意 
图 属于 哪个 技能 时 ， 是 无 法 理解 并 且 执 行 的 。 但 是 ， 有 些 意图 不 
一 定 依赖 于 技能 ， 例 如 “Alexa， 今 天 深圳 天 气 怎么 样 ”这 种 意图 
就 可 以 忽略 技能 而 直接 执行 ， 因 为 它们 默认 属于 系统 技能 。 当 语 
音 设备 上 存在 第 三 方 天 气 技能 时 ， 如 果 用 户 直 接 喊 “Alexa， 今 天 
深圳 天 气 怎么 样 ”， 系 统 还 是 会 直接 执行 默认 的 意图 。 我 们 做 语 
音 交互 更 多 是 在 设计 意图 ， 也 就 是 设计 意图 要 怎么 理解 以 及 执行 
相关 操作 。 

词典 (Dictionary) : 词典 可 以 理解 为 某 个 领域 内 词汇 的 集合 ， 
是 用 户 与 技能 交互 过 程 中 的 一 个 重要 概念 ,例如 “北京 “广州 ”“ 深 
圳 ”都 属于 “中 国 城市 ”这 项 词典 ， 同 时 属于 “地 点 ”这 项 范围 
更 大 的 词典 ， “下 雨 ”“ 人 台风 ”“ 天 上 晴 ” 都 属于 “天 气 ” 这 项 词典 。 
有 些 词 语 会 存在 于 不 同 词典 中 ， 不 同 词典 的 调用 也 会 影响 意图 的 
识别 。 例 如 “刘德华 ”“ 张 学 友 ”“ 陈 奕 迅 ” 都 属于 “ 男 歌星 ” 
这 项 词典 , 同时 他 们 也 属于 “电影 男 演员 ”这 项 词典 。 当 用 户 说 “我 
要 看 刘德华 电影 ”的 时 候 ， 系 统 更 多 是 匹配 到 电影 男 演员 的 “ 刘 
德 华 ”; 如 果 用 户 说 “我 想 听 刘德华 的 歌 ”， 系 统 更 多 是 匹配 到 
男 歌星 词典 里 的 “刘德华 ”。 如 果 用 户 说 出 “打开 刘德华 ”这 类 
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模棱两可 的 话 时 ， 系 统 就 无 法 决策 究竟 是 匹配 视频 意图 还 是 歌曲 
意图 ， 需 要 人 为 设计 相关 的 策略 来 匹配 意图 。 

词 权 (Slot) : 词 梭 可 以 理解 为 一 句 话 中 所 包含 的 参数 是 什么 ， 
而 槽 位 是 指 这 句 话 里 有 多 少 个 参数 ， 它 们 直接 决定 系统 能 否 匹 配 
到 正确 的 意图 。 举 个 例子 , “今天 深圳 天 气 怎 么 样 ” 这 项 天 气 意 图 
可 以 拆 分 成 “今天 ”“ 深 圳 ”“ 天 气 ”“ 怎 么 样 ” 四 个 词语 ， 那 
么 天 气 意图 就 包含 了 “时 间 ”“ 地 点 ”“ 触 发 关键 词 ”“ 无 义 词 ” 
四 个 词 模 。 词 楷 和 词典 是 有 强 关系 的 ， 同 时 词 模 和 槽 位 跟 语言 的 
语法 也 是 强 相 关 的 。 例 如 “声音 大 一 点 ”这 句 话 里 就 包括 了 主语 、 
谓语 和 状语 ， 如 果 缺 乏 主 语 ， 那 么 语音 智能 平台 是 不 知道 哪个 东 
西 该 “大 一 点 ”。 在 设计 前 ， 我 们 要 先 了 解 清楚 语音 智能 平台 是 
否 支 持 词 槽 状态 选择 (可 选 、 必 选 )、 是 否 具备 泛 化 能 力 以 及 槽 
位 是 否 支持 通配符 。 词 槽 和 槽 位 是 设计 意图 中 最 重要 的 环节 ， 它 
们 能 直接 影响 你 未 来 的 工作 量 。 

泛 化 〈Generalize) : 一 个 语音 智能 平台 的 泛 化 能 力 将 直接 影 
响 系 统 能 否 听 懂 用 户 在 说 什么 以 及 设计 师 的 工作 量 大 小 ， 同 时 也 
能 反映 出 该 平台 的 人 工 智能 水 平 到 底 怎 么 样 。 究 竟 什 么 是 泛 化 ? 
泛 化 是 指 同一 个 意图 有 不 同 表达 方式 , 例如 “声音 帮 有 我 大 一 点 ”“ 声 


达 的 差异 可 能 会 直接 导致 模 位 的 设计 失效 ， 从 而 无 法 识别 出 这 名 


话 究 竟 是 什么 意思 。 目前 所 有 语音 智能 平台 的 泛 化 能 力 普遍 较 弱 ， 


需要 设计 师 源源 不 断 地 将 不 同 的 表达 方式 写 入 系统 里 。 词 槽 和 槽 
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位 的 设计 也 会 影响 泛 化 能 力 ， 如 果 设 计 不 当 ， 设 计 人 员 的 工作 可 
能 会 翻 好 几 倍 。 

通配符 (Wildcard Character) : 通配符 主要 用 来 进行 模糊 搜 
索 和 匹配 。 当 用 户 查 找 文 字 时 不 知道 真正 的 字符 或 者 懒得 输入 完 
整 名 称 时 ， 常 常 使 用 通配符 来 代替 字符 。 通 配 符 在 意图 设计 中 非 
常 有 用 ， 尤 其 是 数据 缺乏 导致 某 些 词 典 数 据 不 全 的 时 候 ， 它 能 直 
接 简化 制作 词典 的 工作 量 。 例 如 “XXX” 为 一 个 通配符 ， 当 我 为 
“视频 播放 ”这 项 意图 增加 “我 想 看 XXX 电影 ”这 项 表达 后 ， 无 
论 XXX 是 什么 ， 只 要 系统 命中 “看 ”和 “电影 ”两 个 关键 词 ， 系 
统 都 能 打开 视频 应 用 搜索 XXX 的 电影 。 但 是 ， 通 配 符 对 语音 交互 
来 说 其 实 是 一 把 双 刃 剑 。 假设 我 们 设计 了 一 个 “打开 XXX” 的 意图 ， 
当 用 户 说 “打开 电灯 ”其 实 是 要 开启 物 联网 中 的 电灯 设备 ， 而 “ 打 
开 哈 利 . 波 特 ”其 实 是 要 观看 《 哈 利 . 波 特 》 的 系列 电影 或 者 小 说 。 
当 我 们 设计 一 个 “我 要 看 XXX” 和 “我 要 看 XXX 电影 ”两 个 意 
图 时 ， 很 明显 前 者 包含 了 后 者 。 通 配 符 用 得 越 多 ， 会 影响 词 模 和 
槽 位 的 设计 ， 导 致 系统 识别 意图 时 不 知道 如 何 对 众多 符合 的 意图 
进行 排序 ， 所 以 通配符 一 定 要 合理 使 用 。 

自动 语音 识别 技术 (Automatic Speech Recognition，ASR ) : 
将 语音 直接 转换 成 文字 ， 有 些 时候 由 于 语句 里 某 些 词 可 能 听 不 清 
楚 或 者 出 现 二 义 性 会 导致 文字 出 错 。 
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4.4.2 语音 智能 平台 如 何 听 懂 用 户 说 的 话 


语音 交互 主要 分 为 两 部 分 ， 第 一 部 分 是 “ 听 懂 ”， 第 二 部 分 
才 是 与 人 进行 交互 。 如 果 连 用 户 说 的 是 什么 都 听 不 懂 ， 那 么 就 不 
用 考虑 后 面 的 流程 了 。 这 就 好 比 打 开 的 所 有 网 页 链接 全 是 404 一 
样 ， 用 户 使 用 你 的 产品 会 经 常 感受 到 挫败 感 。 因 此 能 否 “ 听 懂 ” 
用 户 说 的 话 ， 是 最 能 体现 语音 产品 人 工 智能 能 力 的 前 提 。 

决定 产品 是 否 能 听 懂 用 户 说 的 大 部 分 内 容 ， 主 要 由 语音 智能 
平台 决定 ， 我 们 在 做 产品 设计 前 需要 先 了 解 清楚 语音 智能 平台 
以 下 6 个 方面 : 

(1) 了 解 当 前 使 用 的 语音 智能 平台 NLU (Natural Language 
Understanding， 自 然 语言 理解 ) 能 力 如 何 ， 尤 其 是 其 是 否 具备 较 
好 的 泛 化 能 力 。NLU 是 每 个 语音 智能 平台 的 核心 。 

(2) 了 解 系统 的 意图 匹配 规则 是 完全 匹配 还 是 模糊 匹配 。 以 
声音 调整 作为 例子 ,假设 声音 调整 这 个 意图 由 “操作 对 象 ”“ 调 整 ” 
和 “状态 ”三 个 词 槽 决定,“ 声音 提高 一 点 ”这 句 话 里 的 “声音 ”“ 提 
高 ”和 “一 点 ”分 别 对 应 “操作 对 象 *”“ 调 整 ” 和 “状态 ”三 个 词 槽 。 
如 果 这 时 候 用 户 说 “请 帮 有 我 声音 提高 一 点 ”, 这 时 候 因 为 增加 了 “请 
帮 有 我 ”三 个 字 导 致意 图 匹配 不 了 ， 那 么 该 系统 的 意图 匹配 规则 是 
完全 匹配 ， 如 果 能 匹配 成 功 说 明 意图 匹配 规则 支持 模糊 匹配 。 

只 支持 词 槽 完全 匹配 的 语音 智能 平台 几乎 没有 任何 泛 化 能 力 ， 
这 时 候 设计 师 需要 考虑 通过 构建 词典 、 词 柳 和 槽 位 的 方式 实现 意 
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图 泛 化 ， 这 非常 考验 设计 师 的 语言 理解 水 平 、 罗 辑 能 力 以 及 对 整 
体 词 典 、 词 槽 、 模 位 的 全 局 设计 能 力 ， 我 们 可 以 认为 这 项 任务 极 
其 艰巨 。 如 果 语 音 智 能 平台 支持 词 模 模 糊 匹配 ， 说 明 系 统 采用 了 
识别 关键 词 的 做 法 ， 以 刚刚 的 “请 帮 有 我 声音 提高 一 点 ”作为 例子 ， 
系统 能 识别 出 “声音 提高 一 点 ”分 别 属于 “操作 对 象 ”“ 调 整 " 和 “ 状 
态 "三 个 词 槽 , 然后 匹配 对 应 的 意图 , 而 其 他 文字 “请 帮 有 我 ”或 者 “请 
帮 帮 有 我 吧 ” 将 会 被 忽略 。 模 糊 匹配 能 力 对 意图 的 泛 化 能 力 有 了 明显 
的 提升 ， 能 极 大 减少 设计 师 的 工作 量 ， 因 此 要 尽 可 能 选择 具备 模 
糊 匹 配 能 力 的 语音 智能 平台 。 

(3) 当前 使 用 的 语音 智能 平台 对 语言 的 支持 程度 如 何 。 每 种 
语言 都 有 自己 的 语法 和 特点 ， 这 导致 了 目前 的 NLU 不 能 很 好 地 支 
持 各 种 语言 ， 例 如 Alexa、Google Assistant 和 Siri 都 在 深耕 英语 
英文 的 识别 和 理解 ， 但 对 汉语 中 文 的 理解 会 相对 差 很 多 ， 而 国内 
的 DuerOS、AliGenie 等 语音 智能 平台 则 相反 。 

(4) 有 些 词典 我 们 很 难 通 过 手动 的 方式 收集 完整 ， 例 如 具有 
时 效 性 的 名 人 词典 还 有 热 词 词典 。 如 果 收 集 不 完整 最 终结 果 就 是 
系统 很 有 可 能 不 知道 你 说 的 语句 是 什么 意思 。 这 时 候 我 们 需要 官 
方 提供 的 系统 词典 ， 它 能 直接 帮助 我 们 减轻 大 量 的 工作 。 系 统 词 
典 一 般 是 对 一 些 通用 领域 的 词汇 进行 整理 的 词典 , 例如 城市 词典 、 
计量 单位 词典 、 数 字 词 典 、 名 人 词典 还 有 音乐 词典 等 。 因 此 我 们 
需要 了 解 当 前 使 用 的 语音 智能 平台 的 系统 词典 数量 是 否 够 多 ， 每 
个 词典 拥有 的 词汇 量 是 否 齐全 。 
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(5) 了 解 清楚 语音 智能 平台 是 否 支 持 客户 端 和 服务 端 自 定义 
参数 的 传输 ,这 一 项 非常 重要 , 尤其 是 对 带 屏 幕 的 语音 设备 来 说 。 
我 们 做 设计 最 注重 的 是 用 户 在 哪个 场景 下 做 了 什么 ， 简 单 点 就 是 
5W1H: What (什么 事情 )、Where (什么 地 点 ) 、When〈 什 么 时 
候 ) 、Who〈 用 户 是 谁 )、Why〔〈 原 因 ) 和 How 如何) ， 这 些 都 
可 以 理解 为 场景 化 的 多 个 参数 。 据 我 了 解 ， 有 些 语音 智能 平台 在 
将 语音 转换 为 文字 时 是 不 支 传 输 传 自 定义 参数 的 ， 这 可 能 会 导致 
你 在 设计 时 只 能 考虑 多 轮 对 话 中 的 上 下 文 ， 无 法 结合 用 户 的 地 理 
位 置 、 时 间 等 参数 进行 设计 。 为 什么 说 自 定义 参数 对 带 屏 语 音 设 
备 非常 重要 ? 因为 用 户 有 可 能 说 完 一 句 话 就 直接 操作 屏幕 ， 然 后 
继续 语音 对 话 ， 如 果 语 音 设 备 不 知道 用 户 在 屏幕 上 进行 什么 样 的 
操作 ， 可 以 认为 语音 智能 平台 是 不 知道 用 户 整个 使 用 流程 是 怎么 
样 的 。 在 不 同 场景 下 ， 用 户 说 的 话 都 可 能 会 有 不 同 的 意图 ， 例 如 
用 户 在 爱 奇 艺 里 说 “周杰伦 ”， 是 想 看 与 周杰伦 相关 的 视频 ， 如 
果 在 QQ 音乐 里 说 “周杰伦 ”， 则 是 想 听 周杰伦 唱 的 歌曲 。 因 此 ， 
Where 除了 指 用 户 在 哪 座 城 市 , 还 可 以 指 用 户 目前 在 哪个 应 用 里 。 

(6) 当前 使 用 的 语音 智能 平台 是 否 支持 意图 的 自 定义 排序 。 
其 实 ， 意 图 匹配 并 不 是 只 匹配 到 一 条 意图 ， 它 很 有 可 能 匹配 到 多 
个 意图 ， 只 是 每 个 意图 都 有 不 同 的 匹配 概率 ， 最 后 系统 只 会 召回 
概率 最 大 的 意图 。 在 第 5 点 已 提 到 ， 在 不 同 场景 下 用 户 说 的 语句 
可 能 会 有 不 同 的 意图 ， 所 以 意图 应 该 根据 当前 场景 进行 匹配 ， 而 
不 只 是 根据 词 模 来 识别 。 因 此 语音 智能 平台 支持 意图 的 自 定义 排 
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序 非常 重要 ， 它 能 根据 特定 参数 匹配 某 些 低 概率 的 意图 ， 实 现场 
景 化 的 理解 。 当 然 ， 只 有 在 第 5 点 可 实现 的 情况 下 ， 意 图 自 定义 
排序 才 有 意义 。 

(7) 当前 使 用 的 语音 智能 平台 是 否 支 持 表达 方式 的 自 定义 排 
序 。 可 以 认为 ， 表 达 方 式 是 由 词 模 和 槽 位 决定 的 。 如 果 有 些 表 达 
方式 的 槽 位 使 用 了 通配符 ， 必 定 对 其 他 表达 方式 造成 影响 。 例 如 在 
前 文 提 到 的 例子 “我 想 看 电影 ”可 以 理解 为 “我 想 看 ” +“ 通配符 ”， 
这 是 一 个 模糊 搜索 ， 而 “我 想 看 2001 年 刘德华 拍摄 的 动作 电影 ” 
可 以 理解 为 “我 想 看 ”+“ 时 间 ”+ “人物”+“ 通 配 符 ”， 这 是 一 
个 精准 搜索 ， 前 者 的 范围 远 比 后 者 要 广 。 如 果 没有 自 定义 排序 ， 当 
用 户 说 “我 想 看 2001 年 刘德华 拍摄 的 动作 电影 ”， 机 器 可 能 直接 
搜索 “2001 年 刘德华 拍摄 的 动作 电影 ”， 最 后 匹配 不 到 数据 库 里 的 
信息 。 因 此, 应 该 把 更 模糊 、 槽 位 更 少 的 表达 方式 放 在 靠 后 的 位 置 。 

(8) 当前 使 用 的 语音 智能 平台 是 否 支持 声 纹 识别 。 一 台 语 音 
设备 很 有 可 能 被 多 个 人 使 用 ， 而 声 纹 识别 可 以 区 分 当前 正在 使 用 
设备 的 用 户 到 底 是 谁 ， 有 助 于 针对 不 同 用 户 给 出 个 性 化 的 回答 。 





4.4.3 设计 “能 听 懂 用 户 说 什么 ”的 智能 语音 产品 


当 我 们 对 整个 语音 智能 平台 有 较 深 入 的 理解 后 ， 就 可 以 开始 
设计 一 套 “ 能 听 懂 用 户 说 什么 ”的 智能 语音 产品 。 为 了 让 大 家 对 
语音 交互 设计 有 深入 浅 出 的 理解 ， 以 下 内 容 将 为 带 屏 设 备 设 计 一 
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款 智 能 语音 系统 作为 例子 , 使 用 的 语音 智能 平台 不 具备 泛 化 能 力 ， 
但 是 它 可 以 自 定义 参数 传输 和 意图 自 定义 排序 。 整 个 设计 过 程 分 
为 系统 全 局 设计 和 意图 设计 。 

系统 全 局 设计 主要 分 为 以 下 步骤 : 

(1) 如 果 跟 我 们 对 话 的 “人 ”性 格 和 风格 经 常 变化 ， 那 么 我 
们 可 能 会 觉得 他 有 点 问题 ， 所 以 要 为 产品 赋予 一 个 固定 的 人 物 形 
象 。 首 先 ， 我 们 需要 明确 用 户 群体 ， 再 根据 用 户 群 体 的 画像 设计 
一 个 虚拟 角色 ， 并 对 这 个 角色 进行 画像 描述 ， 包 括 性 别 、 年 龄 、 
性 格 、 爱 好 等 ， 还 有 采用 哪 种 音色 。 如 果 还 要 在 屏幕 上 显示 虚拟 
角色 ， 那 么 还 要 考虑 设计 整套 虚拟 角色 的 形象 和 动作 。 完 整 的 案 
例 可 以 参考 微软 小 冰 ， 微 软 把 小 冰 定 义 成 一 位 话 兽 的 17 岁 高 中 女 
生 ， 并 且 为 小 冰 赋 予 了 年 轻 女性 的 音色 以 及 一 整套 少女 形象 。 

(2) 考虑 产品 目的 是 什么 ,将 会 为 用 户 提供 哪些 技能 (应 用 ) ， 
这 些 技能 的 目的 是 什么 ? 用户 为 什么 要 使 用 它 ? 用 户 通 过 技能 能 
做 什么 和 不 能 做 什么 ? 用 户 可 以 用 哪些 方式 调用 该 技能 ? 还 有 产 
品 将 会 深耕 哪个 垂直 领域 , 是 智能 家 居 控 制 ? 音乐 ? 视频 ? 体育 ? 
信息 查询 ? 闲聊 ? 由 于 有 些 意 图 是 通用 而 且 用 户 经 常用 到 的 ， 所 
以 每 个 领域 可 能 会 有 意图 重 到 。 例 如 “打开 哈 利 。 波 特 ” 有 可 能 
属于 电子 书 意图 ， 也 有 可 能 属于 视频 意图 ， 因 此 我 们 要 对 自己 提 
供 的 技能 进行 先后 排序 ， 哪 些 是 最 重要 的 ， 哪 些 是 次 要 的 。 在 这 
里 我 建议 把 信息 查询 和 闲聊 放 在 排序 的 最 后 ， 理 由 请 看 第 三 点 。 

(3) 建立 合适 的 兜 底 方案 。 兜 底 方 案 是 指 语音 完全 匹配 不 上 
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意图 时 提供 的 最 后 解决 方案 。 当 智能 语音 平台 技术 不 成 熟 ， 自 己 
设计 的 语音 技能 较 少 ， 整 个 产品 基本 听 不 懂 人 在 说 什么 的 时 候 ， 
和 兜 底 方案 是 整套 语音 交互 设计 中 最 重要 的 设计 。 兜 底 方案 主要 有 
以 下 三 种 : 
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以 多 种 形式 告知 用 户 系 统 暂时 无 法 理解 用 户 的 意思 ， 例 如 
“抱歉 ， 目 前 还 不 能 理解 你 的 意思 ”“ 我 还 在 学 习 该 技能 
中 ”等 。 这 种 做 法 参考 了 人 类 交流 过 程 中 多 变 的 表达 方式 ， 
使 整个 对 话 不 会 那么 无 聊 、 生 硬 。 这 种 兜 底 方案 的 成 本 是 
最 低 的 ， 并 且 需 要 结合 虚拟 角色 一 起 考虑 。 如 果 这 种 兜 底 
方案 出 现 的 频率 过 高 ， 用 户 很 有 可 能 觉得 你 的 产品 什么 都 
不 懂 ， 很 不 智能 。 

将 听 不 懂 的 语句 传 给 第 三 方 搜索 功能 。 基 本 上 很 多 问题 都 
能 在 搜索 网 站 上 找到 答案 ， 只 是 答案 过 多 导致 用 户 的 操作 
成 本 加 大 。 为 了 体验 更 好 ， 建 议 产品 提供 百科 、 视 频 、 音 
乐 等 多 种 搜索 入 口 。 以 “我 想 看 哈 利 。 波 特 的 视频 ”这 句 
话 为 例子 ， 我 们 可 以 通过 正则 表达 式 的 技能 挖掘 出 “视频 ” 
一 词 ， 同 时 将 “我 想 看 ” “的 ”词语 过 滤 掉 ， 最 后 获取 “ 哈 
利 。 波 特 ” 一 词 ， 直 接 放 到 视频 搜索 里 ， 有 效 降低 用 户 的 
操作 步骤 。 这 种 兜 底 方案 能 简单 有 效 地 解决 大 部 分 常用 的 
查询 说 法 ， 但 用 在 指令 意图 上 会 非常 怪 ， 例 如 “打开 客厅 
的 灯 ” 结 果 跳 去 了 百度 进行 搜索 ， 这 时 候 会 让 用 户 觉 得 产 
品 非常 傻 ， 还 有 ， 如 果 在 设计 整个 兜 底 方案 时 没有 全 局 考 
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虑 清楚 ， 很 有 可 能 导致 截取 出 来 的 关键 词 有 问题 ， 导 致 用 
户 觉得 很 难 理解 。 

。 将 听 不 懂 的 语句 传 给 第 三 方 闲聊 机 器 人 。 有 些 积 累 较 深 的 
第 三 方 闲聊 机 器 人 说 不 定 能 理解 用 户 问 的 是 什么 ， 而 且 提 
供 多 轮 对 话 ， 使 整个 产品 看 起 来 “人 性 化 ”一 点 。 由 于 闲 
聊 机 器 人 本 身 就 有 自己 的 角色 定位 ， 所 以 这 种 兜 底 方案 一 
定 要 结合 虚拟 角色 并 行 考虑 。 而 且 第 三 方 闲聊 机 器 人 需要 
第 三 方 API 支持 ， 是 三 个 兜 底 方案 中 成 本 最 高 的 ， 但 效果 
也 有 可 能 是 最 好 的 。 

人 与 机 器 的 对 话 可 以 概括 为 发 送 指令 、 查 询 信息 和 闲聊 三 种 
形式 ， 以 上 三 种 兜 底 方案 在 实际 应 用 时 都 各 有 优 缺 点 ， 并 且 是 
互 扩 的。 例如， 用 户 发 出 一 个 指令 “请 帮 有 我 打开 屋 里 的 灯 ”， 这 
时 候 机 器 给 出 一 个 搜索 结果 就 会 非常 尴 炊 ， 用 户 闲 聊 “ 早 上 好 
啊 ”， 这 时 候 机 器 说 “不 好 意思 ， 我 听 不 懂 你 说 的 ”也 会 很 尴 众 ， 
因此 设计 师 可 以 根据 实际 需求 选择 最 适合 产品 的 兜 底 方案 ， 要 么 
三 选 一 ， 要 么 通过 更 复杂 的 机 制 来 确认 需要 使 用 的 兜 底 方案 。 为 
了 让 整个 产品 有 更 好 的 体验 , 我 们 不 能 完全 依赖 最 后 的 兜 底 方案 ， 
还 是 需要 设计 更 多 技能 和 意图 匹配 更 多 的 用 户 需求 。 

(4) 查看 语音 智能 平台 是 否 提供 了 与 技能 相关 的 垂直 领域 官 
方 词 典 ， 如 果 没 有 就 需要 考虑 手动 建立 自己 的 词典 。 手 动 建立 的 
词典 质量 决定 了 你 的 意图 识别 准确 率 ， 因 此 建立 词典 时 需要 注意 
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。 该 词典 是 否 有 足够 的 词汇 量 ， 词 汇 的 覆盖 面 决定 了 词典 质 
， 所 以 词汇 量 是 越 多 越 好 。 
。 该 词典 是 否 需要 考虑 动态 更 新 ， 例 如 名 人 、 视 频 、 音 乐 等 
类 别 词典 都 应 该 支持 动态 更 新 。 

。 该 词典 是 否 包含 同义词 ， 例 如 医院 、 学 校 等 词汇 都 应 该 考 
虑 其 他 的 常用 叫 法 。 
如 果 想 精益 求 精 ， 还 需要 考虑 词汇 是 否 是 多 音字 ， 还 有 
是 否 有 常见 的 错误 叫 法 。 有 时 ASR (Automatic Speech 
Recognition， 自 动 语音 识别 ) 会 将 语音 识别 错误 ， 因 此 还 
需要 考虑 是 否 需要 手动 纠正 错误 ， 虽然 最 后 这 个 做 法 工作 
量 可 能 非常 大 ， 但 是 能 有 效 解 决 中 国 各 种 方言 以 及 口音 导 
致 机 器 无 法 听 懂 用 户 说 话 的 问题 。 

(5) 在 场景 的 帮助 下 ， 我 们 可 以 更 好 地 理解 用 户 的 意图 。 由 
于 我 们 的 大 部 分 设备 都 是 使 用 开源 的 安 卓 系统 ， 而 且 语 音 应 用 和 
其 他 应 用 都 相互 独立 ， 信 息 几乎 不 能 传输 ， 所 以 我 们 可 以 通过 安 
卓 官方 的 API 获取 栈 项 应 用 信息 了 解 用 户 当前 处 于 哪个 应 用 。 举 
个 例子 : 用 户 说 出 “刘德华 ”， 如 果 这 时 候 检测 到 用 户 处 于 腾讯 
视频 应 用 ， 那 么 就 发 起 关于 刘德华 视频 的 检索 ， 如 果 用 户 处 于 QQ 
音乐 ， 则 发 起 关于 刘德华 音乐 的 检索 。 如 果 用 户 当前 使 用 的 应 用 
是 由 我 们 设计 开发 的 ， 我 们 还 可 以 将 用 户 的 一 系列 操作 流程 以 及 
相关 参数 传输 给 服务 器 进行 分 析 ， 有 助 于 我 们 更 好 地 判断 用 户 的 
想法 是 什么 ， 并 前 置 最 相关 的 意图 。 








于 膨 于 
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(6) 撰写 脚本 。 脚 本 就 像 电影 或 戏剧 里 的 剧本 一 样 ， 它 是 
定 对 话 如何 互 动 的 基本 。 可 以 使 用 脚本 来 帮助 确认 你 可 能 没 考虑 





保持 互动 简短 ， 避 免 重复 的 短语 。 

写 出 人 们 是 如 何 交 谈 的 ， 而 不 是 如 何 阅 读 和 写作 的 。 

当 用 户 需要 提供 信息 ， 则 给 出 相应 的 指示 。 

不 要 假设 用 户 知道 该 做 什么 。 

用 户 提问 时 ， 一 次 只 问 一 个 问题 。 

让 用 户 做 选择 时 ， 一 次 提供 不 超过 三 个 选择 。 

学 会 使 用 话 轮转 换 (Turn-taking) 。 话 轮转 换 是 一 个 
不 是 特别 明显 但 是 很 重要 的 谈话 工具 ， 它 涉及 了 对 话 中 
我 们 习以为常 的 微妙 信号 。 人 们 利用 这 些 信 号 保持 对 
话 的 往复 过 程 。 缺 少 有 效 的 轮回 ， 可 能 会 出 现 谈话 的 
双方 同时 说 话 ， 或 者 对 话 内 容 不 同步 并 且 难 以 被 理解 
的 情况 。 

对 话 中 的 所 有 元 素 应 该 可 以 绑 定 在 一 起 成 为 简单 的 一 句 
话 ， 这 些 元 素 将 是 我 们 意图 设计 中 最 重要 的 参数 ， 因 此 要 
留意 对 话 中 的 元 素 。 





本 


(7) 最 后 我 们 要 将 脚本 转化 为 决策 树 。 决 策 树 跟 我 们 理解 的 
售 息 架构 非常 相似 ， 也 是 整个 技能 、 意 图 、 对 话 流 程 设计 的 关键 。 
这 时 候 可 以 通过 决策 树 检查 整个 技能 设计 是 否 有 逻辑 不 严密 的 地 
方 ， 从 而 优化 整个 产 设计 。 


= 9 


| Al 改变 设计 | 人 工 智能 时 代 的 设计 师 生存 手册 


以 上 是 全 局 设计 的 相关 内 容 ， 以 下 开始 讲述 意图 设计 。 意 图 
设计 主要 包括 以 下 内 容 : 

(1) 正如 在 前 面 提 到 的 , 意图 识别 是 由 词 权 (参数 ) 和 槽 位 ( 参 
数 数量 ) 决定 的 。 当 一 个 意图 的 槽 位 越 多 ， 它 的 能 力 还 有 复 用 程 
度 就 越 高 ;但 是 槽 位 越 多 也 会 导致 整个 意图 变 得 更 复杂 ， 出 错 的 
概率 就 会 越 高 ， 所 以 意图 设计 并 不 是 槽 位 越 多 就 越 好 ， 最 终 还 是 
要 根据 实际 情况 而 决定 。 当 我 们 设计 词 槽 和 模 位 时 ， 请 结合 当前 
语言 的 语法 和 词性 一 起 考虑 , 例如 每 一 句 话 需要 考虑 主 谓 宾 结 构 ， 
还 有 各 种 名 词 、 动 词 、 副 词 、 量 词 和 形容 词 。 

(2) 当 语 音 智 能 平台 泛 化 能 力 较 弱 时 ， 可 以 考虑 手动 提升 整 
体 的 泛 化 能 力 。 主 要 的 做 法 是 将 常用 的 表达 方式 抽 离 出 来 成 为 独 
立 的 词典 ， 然 后 每 个 意图 都 匹配 该 词典 。 

(3) 如 果 设计 的 是 系统 产品 , 我 们 应 该 考虑 全 局 意图 的 设计 。 
例如 像 带 屏 智能 音箱 、 投 影 仪 都 是 有 实体 按键 的 ， 可 以 考虑 通过 
语音 命令 的 方式 模拟 按键 操作 ， 从 而 达到 全 局 操作 。 例 如 “上 一 
条 ”“ 下 一 个 ” “打开 xxx” 这 些 语音 命令 在 很 多 应 用 内 都 能 用 到 。 

以 下 通过 简单 的 案例 学 习 一 下 整个 意图 是 怎么 设计 的 ， 我 们 
先 从 “开启 /关闭 设备 ”意图 入 手 : 

第 一 步 : 设计 “执行 词典 ”和 “设备 词典 ”， 词 典 如 下 ; 


执行 词典 


词语 其 他 常用 表达 
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设备 词典 
词语 其 他 常用 表达 
电灯 、 灯 、 灯 泡 、 灯 光 、 光 管 、 灯 管 、 日 光 灯 、 荧 光 灯 





Television 电视 、 彩 电 、 彩 色 电 视 


第 二 步 : 设计 “执行 设备 ”的 词 权 为 “执行 ”+ “设备 ”。 
无 论 用 户 说 “ 开 灯 ”或 者 “打开 光 管 ” 时 都 能 顺利 匹配 到 “Turn_ 
on”+ “Light”; 而 用 户 说 “ 关 掉 彩电 ”或 者 “ 关 电视 ”都 能 顺 
利 匹 配 到 “Turn_off”+ “Television”， 从 而 执行 不 同 的 命令 。 

第 三 步 : 为 了 增加 泛 化 能 力 , 我 们 需要 设计 一 个 “语气 词典 ”， 
词典 如 下 : 


语气 词典 
词语 其 他 常用 表达 
Please 帮 有 我 、 请 、 快 帮 我 、 能 不 能 帮 有 我 


吧 、 可 以 吗 、 好 吗 





第 四 步 : 增加 意图 槽 位 。 这 时 候 把 “执行 ”和 “设备 ”两 个 
槽 位 设置 为 必 选 柳 位 ， 意 思 是 对 话 中 这 两 个 词 模 缺 一 不 可 ， 如 果 
缺少 其 中 之 一 需要 多 轮 对 话 询问 ， 或 者 系统 直接 无 法 识别 。 接 着 
增加 两 个 都 为 “语气 ”的 可 选 权 位 ， 可 选 楷 位 的 意思 是 这 人 句 话 可 
以 不 需要 这 个 词 也 能 顺利 识别 。 这 时 候 用 户 说 “请 开 灯 ”“ 能 不 
能 帮 我 开 灯 ”都 能 顺利 匹配 到 “Please”+ “Turn on”+ “Light” 
以 及 “Please”+ “Turn on”+ “Light”+“Suffix”， 由 于 “Please” 
和 “Suffix” 都 属于 “语气 ”可 选 词 槽 的 内 容 ， 所 以 两 句 话 最 后 识 
别 都 是 “Turn on”+ “Light”。 通 过 参数 相 乘 的 方式 ， 我 们 可 以 
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将 整个 “开启 /关闭 设备 ”意图 分 别 执行 4 种 命令 ， 并 泛 化 数 十 
种 常用 表达 出 来 。 

刚刚 也 提 到 ， 多 轮 对 话 的 目的 是 为 了 补 全 意图 中 全 部 必 选 词 模 
的 内 容 。 当 用 户 家 里 存在 数 慢 灯 时 ， 系 统 应 该 将 刚才 的 常用 表达 升 
级 为 “Please”+“Turm on” + “Which” + “Light” + “Suffix”。 
当 用 户 说 “打开 灯 ” 的 时 候 , 系统 应 该 询问 “您 需要 打开 哪 一 蔓 灯 ”， 
再 根据 用 户 的 反馈 结果 执行 相关 命令 。 这 里 有 个 细节 需要 大 家 注 
意 一 下 ， 如 果 是 带 有 屏幕 的 设备 ， 我 们 可 以 考虑 把 相关 引导 显示 
出 来 ， 例 如 “客厅 ”“ 卧 室 ” 等 ， 这 样 不 仅 可 以 减少 用 户 的 思考 
成 本 ， 还 可 以 根据 具体 需求 优先 显示 某 个 关键 词 或 者 广告 ， 因 此 
具有 极 高 的 商业 变现 价值 。 

第 五 步 : 考虑 是 否 增加 通配符 机 制 。 如 果 我 们 建立 不 了 更 
全 面 的 词典 ， 那 么 可 以 在 常用 表达 里 加 入 通配符 。 举 个 例子 : 
“Please”+“Turm on”+“ 全 部 设备 : 通配符 20 字 ”+“Suffix”。 
这 时 候 “Turn_ on” 与 “Suffix” 之 间 的 20 个 字 内 都 默认 为 “全 部 
设备 ”这 个 参数 ， 你 可 以 针对 “全 部 设备 ”这 个 参数 进行 下 一 步 
的 设计 。 这 时 候 问 题 来 了 : 

问题 1 如 果 “Turn_on” 与 “Suffix” 之 间 超 过 20 个 字 怎么 办 ? 

回答 1: 这 个 就 要 根据 场景 考虑 通配符 的 最 大 和 最 小 极限 值 
是 多 少 了 ， 没 有 最 优 解 。 

问题 2: 之 前 设计 的 槽 位 是 否 依然 是 必 选 模 位 ? 

回答 2: 如 果 使 用 了 通配符 ， 就 应 尽量 少 用 必 选 词 槽 ， 否 则 





t= 


| 第 4 章 人工 智能 时 代 下 交互 设计 的 改变 | 


逻辑 会 混乱 。 例 如 “打开 灯 ” 和 “打开 客厅 的 灯 ” 里 的 “ 灯 ” 和 
“客厅 的 灯 ” 都 会 被 识别 为 “全 部 设备 ”这 项 参数 ， 但 “打开 灯 ” 
是 不 知道 要 打开 哪 一 荔 灯 的 ;而 “打开 客厅 的 灯 ” 明 显 是 知道 要 
打开 客厅 的 灯 。 

问题 3: 如果“ 开启 /关闭 设备 ”这 个 意图 只 有 少数 模 位 并 且 
加 入 了 通配符 ， 会 不 会 对 其 他 类 似 执行 意图 造成 影响 ? 例如 “ 打 
开 膳 讯 音 乐 ”“ 打 开 刘 德 华 ”(〈 不 同人 会 有 各 种 千奇百怪 的 说 法 ) 。 

回答 3: 一 定 会 的 。 所 以 最 通俗 、 最 常用 的 说 法 要 慎重 考虑 
通配符 的 使 用 。 

第 六 步 : 确认 表达 方式 的 排序 。 在 前 文 提 到 ， 我 们 应 该 把 
更 模糊 、 模 位 更 少 的 表达 方式 放 在 靠 后 的 位 置 、 例 如 可 增加 一 个 
Where 词典 来 确认 客厅 、 房 间 等 信息 ， 以 下 是 最 终 的 “开启 / 关 
闭 设备 ”意图 设计 : 


1. “Please”+“Tum on” + “Where” + “Which” + “Light” + 





人 “Suffix” 
2. “Please” + “Turn on” + “Where” + “Light” + “Suffix” 
3. “Please” +“Turn on”+“Where”+ “Television” +“Suffix” 
4. “Please” + “Turn on” + “Television” + “Suffix” 
5.“Please”+“Turn on”+“ 全 部 设备 : 通配符 20 字 ”+“Suffix” 
这 样 我 们 能 优先 保障 电视 和 灯 两 个 电器 能 被 语音 唤醒 ， 其 他 
没 加 入 设置 的 电器 则 可 以 通过 通配符 和 兜 底 方案 的 结合 给 出 相应 
的 回答 ， 例 如 回复 用 户 “ 请 帮 有 我 打开 冰箱 ”， 这 时 候 我 们 可 以 告 
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诉 用 户 “ 抱 歉 ， 我 暂时 无 法 打开 冰箱 ， 我 会 更 努力 去 学 习 的 ”， 
这 样 设计 的 语音 系统 看 起 来 会 聪明 一 点 。 

以 上 的 案例 只 是 整个 意图 设计 中 的 一 小 部 分 ， 还 有 很 多 细节 
需要 根据 实际 情况 进行 设计 。 完 成 整个 全 局 设计 和 意图 设计 后 ， 
我 们 应 该 邀请 用 户 进行 实践 与 测试 ， 用 户 这 时 很 有 可 能 会 用 我 们 
没 想到 的 话语 进行 语音 交互 ， 所 以 要 收集 这 些 数据 ， 尽 可 能 地 完 
善意 图 以 及 对 话 设计 ， 避 免 产 品 上 线 后 出 现 问题 。 最 后 ， 关 于 
创建 用 户 故 事 、 撰 写 脚本 和 对 话 流 程 设计 ， 可 以 阅读 Google 的 
Actions on Google Design 和 Amazon 的 Amazon Alexa Voice Desisgm 
Guide 两 份 文档 以 及 相关 的 语音 智能 平台 的 官方 使 用 文档 ， 里 面 
会 更 详细 地 介绍 相关 细节 。 
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5.1 新 的 设计 对 象 


计算 机 的 难以 使 用 和 普及 需求 ， 催 生出 交互 设计 这 个 术语 ， 
交互 设计 专门 解决 计算 机 如 何 更 好 地 与 用 户 交流 互动 的 问题 。 设 
计 师 在 设计 计算 机 界面 的 过 程 中 ， 也 总 结 出 一 个 新 术语 : 以 用 户 
为 中 心 的 设计 ， 即 在 设计 时 考虑 用 户 的 体验 和 感受 。 此 后 , “用 户 
体验 设计 ”这 个 术语 逐渐 扩散 到 各 行 各 业 ， 它 所 带 来 的 价值 让 各 
个 企业 明白 了 提高 体验 的 重要 性 一 一 你 的 产品 体验 不 好 ， 用 户 就 
有 其 他 竞 品 可 供 选 择 ， 所 以 大 家 开始 关注 用 户 体 验 ， 到 后 面 也 衍 
生出 “服务 设计 ”等 专业 术语 。 

但 现在 的 用 户 体验 设 计 存 在 着 一 个 局 限 性 : 它 的 设计 对 象 仍 
然 是 产品 ， 它 只 关心 用 户 在 使 用 产品 期 间 的 体验 ， 不 关心 产品 对 
用 户 其 他 方面 的 影响 。 这 是 可 以 理解 的 ,因为 企业 间 存 在 着 竞争 ， 
互通 数据 、 分 析 数 据 需要 非常 高 的 成 本 。 所 以 只 关注 自身 产品 体 
验 好 了 ， 最 大 受益 者 自然 是 企业 ， 并 非 用 户 。 





(User Experience) 最 大 区 别 是 : UX 构建 的 是 每 一 件 小 事 ，EX 
构建 的 是 用 户 经 历 ， 基 础 是 每 件 小 事 之 间 的 联动 。 简 单 点 说 ， 人 
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们 生活 中 每 天 发 生 的 琐碎 小 事 不 会 被 记 住 ， 例 如 吃 饱 睡 好 ;但 特 
殊 的 经 历 会 被 记 住 ， 例 如 在 迪士尼 公园 的 路 上 突然 跑 出 来 一 群 鸭 
子 ， 你 会 记 住 那 次 惊喜 。EX 更 多 关注 全 局 性 ， 就 像 迪 士 尼 乐园 
通过 把 控 全 局 体验 为 游客 带 来 惊喜 。EX 是 个 性 化 服务 的 基础 ， 
它 会 从 多 个 维度 包括 用 户 画像 和 行为 、 场 景 和 环境 、 上 下 文 的 理 
解 〈 前 面 发 生 了 什么 事情 ， 后 面 安 排 了 什么 事情 ) 等 为 用 户 创造 
价值 。 

日 本 设计 大 师 深 泽 直 人 也 提 及 过 类 似 的 观点 : “每 个 设计 对 
象 都 是 一 个 元 素 ， 但 这 个 元 素 需 要 放 在 一 个 大 的 环境 中 思考 。 轮 
廓 是 设计 对 象 和 周围 介质 之 间 的 界限 , 是 设计 对 象 和 环境 的 关联 。 
把 产品 比 作 一 个 拼图 的 模块 ， 有 两 种 角度 去 看 待 它 : 一 种 是 将 其 
作为 一 个 元 素 ， 看 到 的 是 单个 物体 的 轮廓 ， 另 外 一 种 是 将 其 看 成 
是 整个 环境 中 缺失 的 那 部 分 的 轮廓 。 如 果 单个 物体 的 轮廓 跟 环境 
当中 缺失 的 轮廓 可 以 契合 的 话 ， 我 们 的 生活 才 是 和 谐 的 。 如 果 这 
个 契合 没有 做 到 ， 我 们 生活 当中 的 这 种 和 谐 就 会 被 打破 ， 一 切 都 
会 分 骨 离 析 。 环 境 当 中 所 缺失 的 这 个 部 分 的 轮廓 是 可 以 找到 的 ， 
只 是 需要 我 们 用 心 去 感受 、 去 理解 、 去 寻找 。 只 有 找到 了 这 个 缺 
失 部 分 的 轮廓 , 才能 够 去 定义 我 们 需要 设计 的 东西 的 轮廓 是 什么 。 
因此 在 设计 的 时 候 ， 我 们 必须 要 积极 地 去 预测 ， 我 们 所 设计 的 产 
品 会 放 在 什么 样 的 环境 当中 ， 然 后 再 将 这 个 产品 的 轮廓 形式 设计 
出 来 。 我 们 需要 做 的 是 设计 已 经 存在 的 物体 之 间 的 关系 ， 无 论 是 
用 物 联 网 、 大 数据 ， 或 者 是 人 工 智能 ， 这 些 概念 都 可 以 ， 但 最 根 
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本 的 是 物体 之 间 的 关系 ， 我 们 一 定 要 更 好 地 去 设计 这 些 不 可 见 的 
东西 。 即 使 是 像 水 壶 和 茶壶 这 么 简单 的 东西 ， 也 必须 要 契合 环境 。” 

2018 年 苹果 全 球 开发 者 大 会 (WWDC) 上 ， 蔷 果 新 发 布 的 
iOS 12 增加 了 一 项 Shortcuts 技能 ， 通 过 Shortcuts， 用 户 可 以 通 
过 Siri 执行 任何 应 用 程序 的 快速 操作 。 在 Shortcuts 的 编辑 器 中 ， 
它 有 一 连 串 的 连锁 行动 、 一 系列 的 动作 类 别 ， 你 可 以 随便 拖 动 它 
们 ， 然 后 它 会 按 顺序 执行 。 通 过 设 定 ，Siri 会 根据 用 户 的 使 用 习 
惯 ， 在 恰当 的 时 间 提 供 对 应 的 行动 建议 ， 例 如 在 早上 提醒 用 户 点 
咖啡 ， 或 是 在 下 午 提醒 用 户 锻炼 。 用 户 仅 需 创建 简单 的 语音 命令 ， 
就 能 开启 复杂 的 工作 流程 。 这 个 新 技能 已 经 非常 接近 EX 的 理 
念 ， 在 未 来 的 人 工 智 能 时 代 下 ， 各 种 用 户 数据 的 打通 使 产品 之 间 
建立 联系 成 为 可 能 ， 产 品 设计 可 以 考虑 引入 IFTTT (If This Then 
That， 即 如 果 一 件 事 发 生 了 ， 那 么 就 触发 另外 一 件 事 ) 或 者 类 似 
Workflow 〈 也 就 是 Shortcuts 的 前 身 ) 的 机 制 ， 站 在 用 户 的 视角 为 
用 户 带 来 更 多 的 服务 和 体验 。 

当 设 计 对 象 从 单个 产品 转变 到 用 户 的 经 历 和 当前 环境 时 ， 设 
计 师 不 能 只 考虑 自己 的 产品 体验 ， 应 该 从 大 局 出 发 ， 思 考 每 个 产 
品 之 间 的 联动 ， 考 虑 不 同 场景 下 自己 的 产品 如 何 服务 用 户 以 及 如 
何 与 其 他 的 产品 联动 。 产 品 设计 从 单 体 变 成 一 块 需要 考虑 兼容 上 
下 左右 外 部 环境 的 拼图 ， 这 对 设计 师 来 说 是 一 个 全 新 的 挑战 。 
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5.2 ”参考 与 人 类 交流 的 方式 


人 工 智能 为 个 性 化 服务 带 来 新 的 可 能 ， 要 想 设计 一 款 更 友善 、 
更 像 人 类 的 产品 ， 需 要 先 来 看 一 下 人 类 是 怎么 交流 的 。 人 与 人 之 
间 的 交流 分 为 双向 交流 和 单 向 交流 〈 单 向 交流 指 对 方 可 以 给 予 简 
单 的 反馈 ， 甚 至 不 需要 提供 反馈 ) ， 双 向 交流 包括 了 提问 和 回答 ， 
单 向 交流 包括 了 指令 、 陈 述 和 接收 信息 。 

提问 和 指令 不 太一 样 。 提 问 是 因为 自己 不 知道 ， 希 望 对 方 能 
提供 相关 的 完整 答案 (这 里 忽略 明知 故 问 和 反问 两 种 带 有 目的 性 
的 情感 交流 ) ; 指令 更 多 是 指 上 级 对 下 级 的 指示 ， 使 用 者 知道 对 
方 能 做 什么 ， 希 望 对 方 能 帮助 自己 完成 某 项 任务 ， 对 方 完成 后 的 
反馈 可 能 非常 简单 ， 一 句 “OK”“ 搞 定 ”“ 对 不 起 ， 我 还 做 不 到 ” 
已 经 能 表达 清楚 ， 所 以 指令 的 反馈 不 需要 太 多 内 容 。 陈 述 的 意思 
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是 我 将 信息 传达 给 你 就 完成 了 , 你 可 以 不 给 予 我 反馈 ,例如 演讲 、 
授课 、 讲 述 内 容 等 。 接 收 信息 则 是 多 渠道 的 ， 包 括 了 听觉 、 视 觉 、 
触觉 ， 甚 至 是 嗅觉 和 味觉 。 

随 着 信息 的 增加 ， 当 其 超过 人 类 的 记忆 容量 时 ， 人 类 通过 交 
流 获取 信息 的 效率 逐渐 降低 ， 他 们 开始 将 信息 通过 各 种 方式 记录 
保存 下 来 ， 到 后 面 逐 渐 出 现 了 书籍 。 随 着 技术 的 发 展 ， 人 类 获取 
信息 的 方式 也 在 逐渐 增加 ， 收 音 机 、 电 视 、 计 算 机 、 手 机 逐渐 出 
现在 我 们 的 生活 中 ， 我 们 先 来 看 看 人 与 不 同 媒介 交流 信息 时 有 什 
么 不 同 ， 再 来 推断 人 工 智能 能 做 什么 。 


人 与 不 同 媒介 交流 信息 的 方式 


方式 /媒介 人 


提问 多 种 


多 种 











从 表格 可 以 推断 出 ， 人 工 智能 要 做 到 与 人 正常 交流 需要 在 提 
问 、 回 答 、 指 令 、 接 收 信息 四 个 方面 有 所 深造 : 提问 更 多 是 指 人 
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通过 语音 、 文 字 、 肢 体 动作 等 对 话 方式 向 计算 机 提出 问题 〈 语 音 


是 最 快 、 最 直接 的 表达 方式 ) ， 计 算 机 理解 问题 后 给 出 正确 完整 
的 答案 。 回 答 更 多 是 指 计算 机 需要 通过 如 传感器 、 用 户 事件 监听 


等 隐形 手段 获取 更 多 的 用 户 数据 ， 这 样 能 更 好 地 了 解 用 户 。 指 令 
更 多 是 指 用 户 通过 语音 、 界 面 和 肢体 动作 发 出 指令 ， 计 算 机 理解 
指令 后 完成 一 系列 的 操作 。 接 收 信息 更 多 是 指 用 户 给 出 问题 和 指 
令 后 ， 计 算 机 如 何 提供 正确 的 答案 和 反馈 。 


5.3 ”人 工 智能 设计 八 原则 


我 总 结 了 八条 设计 师 需 要 注意 的 原则 ， 供 设计 人 工 智能 产品 


时 参考 : 
(1) 个 性 化 : 产品 能 够 根据 用 户 的 个 人 喜好 以 及 周围 环境 进 
行 自动 调整 。 


(2) 环境 理解 : 用户 所 处 的 环境 是 对 用 户 的 行为 进行 推断 并 
提供 符合 需求 服务 的 必要 信息 ， 所 以 未 来 的 人 工 智能 设备 应 该 能 
够 理解 当前 用 户 活动 发 生 时 的 环境 并 给 出 相应 的 反馈 ， 环 境 包 括 
了 用 户 的 位 置 、 身 份 、 状 态 等 信息 ， 以 及 物理 世界 和 数字 系统 的 
信息 《环境 理解 也 就 是 我 们 常 说 的 上 下 文理 解 ) 。 

(3) 安静 : 设计 产品 时 应 该 尽 可 能 减少 设备 所 需 的 注意 力 ， 
设备 可 以 主动 和 用 户 交流 但 并 不 需要 时 常 和 用 户 说 话 ， 所 以 设计 
时 应 该 考虑 用 户 注意 范围 的 边缘 ， 避 免 产 品 经 常 打扰 到 用 户 。 未 
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来 的 产品 大 部 分 时 间 应 该 能 为 了 满足 用 户 的 利益 而 行动 ， 不 需要 
用 户 时 常 做 有 意识 的 操作 安静 地 融入 环境 并 自动 运行 ); 当 用 
户 需要 和 它 交 互 时 ， 它 则 能 够 对 用 户 的 行为 做 出 推断 并 及 时 做 出 
响应 《主动 与 用 户 进行 交互 ) 。 

(4) 安全 “后 门 ”: 尽管 人 工 智能 设备 越 来 越 “ 聪 明 ”， 能 
自主 完成 更 多 任务 ， 但 是 一 出 问题 时 ， 自 动 完成 任务 的 失效 可 能 
会 导致 不 同 程度 上 灾害 的 发 生 ， 所 以 我 们 要 考虑 给 用 户 多 条 可 以 
重启 系统 的 “后 门 ”， 例 如 设备 出 现 问题 时 系统 仍然 可 用 ， 用 户 
可 以 手动 将 系统 修复 ;或 者 留 一 个 安全 开关 ， 用 户 可 以 迅速 将 设 
备 关 机 重启 。 

我 认为 以 上 四 点 是 设计 任何 一 款 人 工 智能 产品 都 需要 注意 的 ， 
如 果 你 的 产品 需要 和 人 经 常 互动 ， 那 就 要 考虑 机 器 和 人 如 何 交流 。 
在 上 文 已 经 讲 到 人 与 人 之 间 如 何 交流 ， 如 果 牵 扯 到 辈分 、 利 益 等 
关系 ， 人 类 之 间 的 交流 务必 会 产生 情感 上 的 交流 ， 在 交流 时 最 能 
表达 情感 的 是 态度 和 语气 ， 人 和 机 器 的 交流 也 毫 不 例外 。 人 工 智 
能 需要 学 会 与 人 类 交流 时 ， 根 据 不 同 场景 和 对 话 内 容 采 用 合适 的 
态度 和 语气 。 在 交流 中 ,机 器 更 多 承担 的 是 下 级 以 及 朋友 的 角色 ， 
直 白 点 说 ， 其 定位 就 是 要 你 干 嘛 就 干 嘛 准确 性 ) ; 要 你 做 就 赶 
紧 做 (即时 性 ); 说 你 不 对 就 得 改 ( 自 我 学 习 与 修正 ); 不 能 项 嘴 ( 有 
礼貌 ); 尽管 “我 ”对 你 很 苛刻 ， 你 也 要 对 “我 ” 像 好 朋友 一 样 
(人 格 设 定 ) 。 结 合 交 流 方式 和 情感 表达 ， 设 计 一 款 面向 用 户 的 
人 工 智 能 产品 时 需要 注意 以 下 四 点 : 
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(5) 准确 性 和 即时 性 : 需要 听 懂 用 户 的 问题 和 指令 并 立刻 给 
出 准确 的 答案 或 反馈 。 准 确 性 和 即时 性 是 人 工 智能 最 基础 的 能 力 
之 一 ， 多 次 回答 错误 显得 人 工 智 能 很 吊 蠢 ， 用 户 会 逐渐 对 人 工 智 
能 失去 信心 和 信任 。 在 技术 不 成 熟 的 时 候 ， 可 以 引入 天 然 有 呆 、 冒 
失 女 等 智商 不 高 但 又 很 懂 卖 靖 的 角色 性 格 弥补 技术 上 的 缺陷 ， 这 
样 可 以 通过 打 情 感 牌 减少 用 户 愤怒 甚至 失望 的 情绪 。 

(6) 自我 学 习 与 修正 : 当 人 工 智能 不 知道 答案 和 操作 时 ， 除 
了 给 出 抱歉 的 反馈 外 ， 更 多 需要 的 是 通过 自我 学 习 能 力 来 修正 自 
己 的 数据 库 和 扩充 自己 的 知识 图 谱 ， 避 免 多 次 惹恼 用 户 。 还 有 一 
点 是 ， 当 机 器 出 现 问题 而 且 不 能 进行 自我 修正 时 ， 一 定 要 预 留 安 
全 “后 门 ”。 

(7) 有 礼貌 : 及 时 回复 、 不 重复 说 话 、 不 反 驶 、 不 打 断 用 户 
的 说 话 和 操作 都 属于 礼貌 问题 ， 就 像 人 类 一 样 ， 有 礼貌 的 人 工 智 
能 才 会 受用 户 欢 迎 。 在 不 重复 说 话 上 ， 日 本 的 一 款 专 为 宅男 定制 
的 家 用 智能 化 全 息 机 器 人 Gatebox 做 得 还 不 错 ， 当 里 面 的 虚拟 形 
象 Azuma Hikari 听 不 懂 用 户 说 的 话 时 ， 她 会 通过 神态 、 语 言 和 肢 
体 动 作 的 结合 给 出 数 十 种 听 不 懂 的 反馈 ， 是 一 个 很 不 错 的 案例 。 

(8) 人 格 设 定 : 为 了 避免 在 交流 中 过 于 死板 或 者 态度 语气 频 
繁 变 化 ， 设 计 师 应 该 针对 不 同 用 户 群体 为 人 工 智能 赋予 不 同 的 角 
色 与 性 格 。 例 如 针对 二 次 元 宅男 群体 ， 赋 予 人 工 智能 傲 娇 、 元 气 
等 性 格 ;， 针 对 成 熟女 性 群体 ， 赋 了 巴 人工 智能 温柔 的 管家 角色 。 尽 
量 不 要 赋予 人 工 智能 老板 、 父 母 、 老 师 等 角色 ， 因 为 指令 这 些 角 
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色 干 活 时 ， 会 让 人 感觉 到 篮 炊 。 如 何 快速 了 解 用 户 的 个 人 喜好 和 
性 格 ? 我 认为 可 以 参考 心理 学 相关 的 调查 问卷 进行 了 解 并 根据 结 
果 为 用 户 设计 完整 的 人 工 智能 人 格 。 在 整个 设计 过 程 中 ， 要 保持 
人 工 智 能 的 人 格 统一 ， 无 论 是 话 术 还 是 动作 都 要 有 严格 的 人 格 规 
范 在 背后 做 支撑 ， 这 样 的 人 工 智 能 才 不 是 精神 分 裂 的 人 工 智 能 。 
微软 小 冰 在 日 本 的 角色 定位 是 “ 话 非 常 多 的 高 中 女生 ”， 深 受 日 
本 用 户 欢迎 。 人 格 规范 就 跟 设计 规范 一 样 ， 只 有 规范 统一 了 ， 产 
品 的 体验 才 是 统一 的 。 











5.4 简化 人 工 智能 的 理解 


目前 的 人 工 智能 更 多 属于 技术 领域 ， 对 于 大 部 分 设计 师 来 说 是 
陌生 的 ， 解 释 起 来 可 能 比较 费劲 ， 如 果 将 人 工 智能 比 作 人 脑 并 抽象 
概括 ， 可 以 分 为 三 大 模块 一 记忆 、 思 考 和 行动 , 这 样 会 好 解释 一 点 。 


站 g 


人 工 智能 的 三 大 模块 
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在 我 看 来 ， 交 互 设 计 师 设计 的 行为 都 是 具备 目的 性 的 。 在 心 
理学 中 ， 目 的 性 属于 意识 的 一 部 分 ， 而 记忆 、 思 考 和 行动 都 是 影 
响 人 意识 的 重要 因素 。 如 果 我 们 要 设计 一 款 人 工 智能 产品 ， 尽 管 
现在 的 技术 还 不 能 做 到 让 它 像 人 类 一 样 有 意识 ， 但 我 们 可 以 看 一 
下 记忆 、 思 考 和 行动 是 如 何 影响 产品 设计 的 。 


5.4.1 记忆 


记忆 相当 于 计算 机 的 数据 ， 属 于 人 工 智 能 三 大 要 素 之 一 ， 
也 属于 有 意识 行为 的 最 底层 。 若 想 优 化 行为 ， 增 强 记忆 是 必 不 

可 少 的 。 以 现状 来 说 ， 合 作 共 赢 打 通 各 种 数据 是 增强 记忆 的 途 
径 之 一 ， 通 过 不 同 领域 的 数据 对 用 户 画 像 进行 补充 ， 从 而 加 深 
对 用 户 的 理解 。 

另外 一 个 途径 是 系统 平台 以 第 三 方 记录 员 的 角色 获取 用 户 的 
行为 和 数据 ， 这 种 方法 适用 在 只 有 简单 行为 的 系统 平台 上 ， 例 如 
Alexa 语音 系统 了。 如 果 将 Skill (语音 软件 应 用 术语 ) 比 作 人 类 ， 
而 我 充当 Alexa 的 角色 ， 那 么 每 当 用 户 和 不 同 的 Skill 对 话 时 ， 我 
都 会 记录 保存 他 们 的 对 话 。 在 整合 所 有 对 话 记 录 (拥有 所 有 记忆 ) 
后 ， 即 使 我 不 知道 用 户 和 Skill 各 自在 想 什么 ， 但 我 能 从 对 话 记 录 
中 判断 出 用 户 是 一 个 什么 样 的 人 ， 他 想 要 什么 。 就 像 我 可 以 从 一 
个 陌生 人 与 别人 的 交流 中 判断 出 他 的 为 人 和 性 格 。 





@ 目前 Alexa 已 拥有 界面 和 语音 系统 。 
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由 于 和 语音 系统 的 交互 只 有 语音 对 话 这 种 方式 ， 而 且 对 话 内 
容 质 量 高 〈 简 单 直 白 ) ， 这 为 记录 用 户 的 行为 提供 了 很 大 帮助 。 
语音 系统 只 需要 在 语音 合成 (喇叭 ) 和 语音 识别 (麦克 风 ) 上 增 
加 记录 接口 ， 就 可 掌握 每 个 Skill 与 用 户 对 话 的 内 容 ， 通 过 对 话 内 
容 转 换 成 有 用 数据 ， 就 可 以 拥有 该 用 户 的 画像 。 








一 一 > Skill 发 出 的 内 容 


| 加 四 


语音 识别 一 一 ~ Skill 接收 的 内 容 


自然 语言 处 理 


数据 库 





语音 系统 数据 管理 概念 图 


相 比 语音 系统 ， 界 面 系统 就 很 难 做 到 这 一 点 。 由 于 用 户 都 是 
通过 点 击 触摸 的 输入 方式 与 界面 系统 交互 ， 系 统 很 难 知 道 文字 、 
图 片 的 内 容 和 关系 是 什么 ， 很 难 断 定 用 户 在 做 什么 ， 所 以 界面 系 
统 应 该 通过 与 每 个 应 用 共享 数据 的 方式 了 解 用 户 更 为 合适 

每 个 产品 可 将 自己 的 数据 分 为 共享 和 隐私 两 种 模块 ， 共 享 数 
据 模块 可 供 系统 和 其 他 产品 使 用 ， 这 样 有 利于 产品 之 间 的 数据 互 
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补 ， 从 而 促进 自身 发 展 。 最 重要 的 是 ， 这 种 做 法 能 为 人 工 智能 系 
统 提 供 更 完整 的 数据 〈 记 忆 ) ， 有 助 于 刻画 用 户 画 像 ， 促 进 人 工 
智能 发 展 。 





5.4.2 思考 


思考 是 连接 记忆 和 行动 的 桥梁 ， 也 是 人 工 智 能 最 核心 的 部 分 : 
如 何 将 数据 转化 为 有 用 的 信息 加 以 利用 。 人 会 思考 是 因为 人 脑 拥 
有 一 个 “记忆 - 预测 ”模型 ， 简 单 点 说 就 是 人 可 以 通过 感官 将 信 
息 存 储 在 大 脑 里 ， 下 次 碰 到 类 似 场 景 会 预测 相关 事物 并 给 出 反应 。 
举 个 例子 ， 乒乓 球 应 该 是 最 快 的 球 类 运动 ， 一 个 来 回 只 有 1 一 2 秒 ， 
选手 需要 在 很 短 时 间 内 判断 球 是 上 旋 、 下 旋 还 是 侧 旋 ， 以 及 预测 
出 球 的 速度 和 轨迹 ， 最 后 思考 采用 哪 种 击 打 方式 、 击 打 力 度 和 击 
打 方向 取得 胜利 。 这 种 球 感 是 通过 长 期 的 “记忆 - 预测 ”训练 得 
来 的 。 

再 举 一 个 例子 一 一 直觉 。 直 觉 也 是 一 种 预测 ， 它 是 基于 记忆 、 
知识 和 环境 所 产生 的 一 种 速度 快 到 让 你 难以 置信 的 思考 方式 。 毫 
不 夸张 地 说 ， 人 类 能 从 躲避 凶猛 野兽 的 远古 时 代 活 到 现在 ， 直 觉 
功 不 可 没 。 

由 于 技术 仍 未 成 熟 ， 目 前 的 产品 基本 做 不 到 思考 这 一 点 。 当 
产品 本 身 不 懂 思 考 时 ， 就 对 自己 该 做 什么 没有 意识 ， 甚 至 导致 用 
户 与 产品 无 法 交流 。 为 了 避免 这 种 情况 ， 各 个 企业 需要 找 专门 的 
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人 才 蔡 代 计 算 机 梳理 数据 并 设计 各 种 行为 ， 在 产品 背后 出 力 ， 使 
产品 看 起 来 “能 思考 ， 懂 预测 ”。 
人 工 设计 的 产品 预测 能 力 有 限 ， 基 本 使 用 在 一 些小 细节 上 。 
下 面 是 几 个 例子 : 
(1) 用 户 在 淘宝 网 购 填写 收 货 地 址 后 ， 产 品 会 收录 该 地 址 ; 
次 用 户 网 购 时 ， 产 品 预测 用 户 在 很 大 概率 上 会 使 用 上 一 次 填 
写 的 收 货 地 址 ， 故 默认 为 用 户 选择 上 次 填写 的 收 货 地 址 。 





will 中 国联 通 令 上 午 11:26 


< 确认 订单 





收 货 人 : 薛 先生 


© 收 货 地 址 : 广东 省 深圳 市 南山 区 粤 海 街道 学 府 路 深 
圳 百度 国际 大 厦 


创 天 音响 
wea Ha | 雅 琴 MC-13S 合 并 式 推 挽 放 大 器 HIFI 发 烧 
Li 胆 机 电子 管 功 放 机 6CA7T 
C bs 
IE ¥2680.00 X1 
淘宝 订单 确认 页 
(2) 腾讯 视频 预测 用 户 的 下 一 次 回访 ， 很 大 概率 是 为 了 继续 


观看 上 次 没 看 完 的 电视 剧 ， 从 而 把 部 分 历史 记录 如 “你 正在 追 的 ” 
放 在 首 屏 ， 用 户 能 直接 观看 上 次 看 过 的 电视 剧 。 
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中 国联 通 全 上 午 11:21 Soim 
精 选 爱 看 电视 剧 电影 时 尚 服饰 三 


Q 注 心 风暴 3[ 国 语 版 ] 加 由 阁 





(is 


此 【限时 5 折 】VIP5 周 年 会 员 全 场 5 折 ， 仅 限 3 天 ! 





注 心 风暴 3[ 粤 语 版 ] 粤语 


回 9ia 评 和 山 包 
你 正在 追 的 > 





日 加 
10 ul 12 
片花 资讯 
会 | 如 S ok 客串 届 的 一 股 清流 ! 马 滩 伟 光 
- i 了 束 下 线 领 全 饭 
腾讯 视频 播放 记录 


(3) 如 果 用 户 在 某 时 间 段 使 用 某 款 产品 频率 较 高 ， 在 同一 时 
间 段 内 iOS 会 在 锁 屏 页 右 下 角 显 示 该 应 用 图 标 ， 方 便 用 户 直接 打 
开 该 应 用 。 

以 上 几 个 案例 都 是 通过 简单 的 “记忆 - 预测 ”优化 产品 流程 ， 
在 一 定 程度 上 降低 了 用 户 使 用 成 本 ， 提 高 了 用 户 体验 。 而 以 下 这 
些 案例 都 是 通过 “记忆 - 预测 ”增加 产品 收益 的 : 

(1) 亚马逊 、 京 东 都 会 通过 用 户 的 浏览 记录 和 购买 记录 预测 
用 户 需要 的 商品 并 给 出 相关 推荐 ， 在 一 定 概率 下 促使 用 户 能 多 购 
买 一 件 商品 。 
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(2) 百度 、 今 日 头条 都 会 通过 用 户 的 浏览 记录 不 断 优化 
FEED 流 文章 ， 越 到 后 面 推 荐 的 文章 越 精准 ， 对 推荐 的 文章 感 兴趣 ， 
用 户 使 用 产品 的 时 长 就 会 逐渐 增加 ， 浏 览 到 的 广告 也 会 随 之 增加 。 

毫 不 夸张 地 说 ， 预 测 是 人 工 智 能 产品 设计 时 最 需要 考虑 的 因 
素 , 它 往往 决定 了 系统 和 流程 的 复杂 程度 。 用 户 行为 预测 得 越 准 ， 
产品 可 以 为 用 户 省 下 更 多 操作 流程 ， 用 户 需求 预测 得 越 准 ， 可 以 
为 产品 带 来 更 大 的 收益 。 如 何 又 准 又 快 地 预测 出 用 户 行为 和 用 户 
需求 并 做 出 响应 ， 是 人 工 智能 时 代 设 计 好 坏 的 衡量 标准 之 一 。 








5.4.3 ”行动 


相 比 起 底层 的 记忆 和 思考 ， 设 计 师 关 注 更 多 的 是 人 工 智能 产 
品 如 何 与 人 交流 互动 ， 如 果 人 工 智能 的 能 力 越 来 越 厉害 ， 那 么 会 
对 行动 的 设计 带 来 什么 样 的 影响 ? 

以 下 是 我 整理 的 结论 ， 前 面 三 点 都 是 环 环 相 扣 的 : 

(1) 简化 流程 (行动 〉; 

(2) 替 用 户 思 考 下 一 步 操作 是 什么 ; 

(3) 根据 当前 环境 、 记 忆 设计 流程 ; 

(4) 开始 考虑 小 众 需 求 ， 设 置 流程 分 支 ; 

(5) 结合 语音 用 户 界 面 一 起 设计 流程 。 

简化 流程 ， 结 合 当前 环境 和 记忆 替 用 户 思 考 下 一 步 操作 

前 文 也 提 过 ， 当 人 工 智 能 的 预测 能 力 增强 ， 部 分 流程 的 设计 
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就 可 以 简化 。 如 果 能 通过 环境 和 记忆 预测 出 用 户 需要 什么 ， 整 个 
操作 流程 能 进一步 简化 。 后 续 设 计时 应 该 结合 人 工 智 能 能 力 展开 
设计 。 以 下 是 我 设想 的 几 个 相关 案例 : 

《1) 当 用 户 走 进 一 家 优 衣 库 ， 优 衣 库 通过 NFC 技术 与 用 户 的 
手机 交换 信息 ， 摄 像 头 开始 留意 用 户 的 行动 。 如 果 用 户 在 一 件 裙 
子 面前 停留 很 久 却 没 购买 ， 用 户 离开 时 优 衣 库 会 将 裙子 信息 发 送 
到 用 户 手机 。 过 了 一 段 时间 裙 子 降价 时 ， 优 衣 库 还 会 将 裙子 的 优 
惠 信息 和 购买 链接 推送 给 用 户 。 该 案例 是 结合 线 上 、 线 下 行为 或 
信息 进行 推荐 。 

(2) 用 户 收 到 了 周 四 上 午 要 去 纽约 开会 的 邮件 ， 该 邮件 相关 
信息 已 录入 到 用 户 日 程 里 。 当 用 户 打开 携程 购买 机 票 时 ， 携 程 会 
访问 日 程 信息 并 为 用 户 推送 关于 周 四 前 飞 往 纽约 的 特价 机 票 信息 ; 
当 用 户 购 买 机 票 后 ， 携 程 会 根据 会 议 地 址 为 用 户 推送 相关 酒店 业 
务 。 该 案例 是 通过 多 产品 信息 联动 ， 减 少 操作 流程 。 

《3) 用 户 在 肯德基 打开 支付 宝 ， 支 付 宝 通过 NFC 技术 或 地 理 
位 置信 息 将 肯德基 卡 包 信息 前 置 到 首页 ， 方 便 用 户 使 用 。 该 案例 
是 结合 地 理 位 置 进行 推荐 ， 减 少 操作 流程 。 

(4) 淘宝 可 以 根据 用 户 购 买 生活 用 品 〈 特 别 是 纸巾 、 洗 发 水 
和 牙膏 等 消耗 品 ) 的 频率 ， 判 断 用 户 当 前 是 否 需要 再 次 购买 该 用 
品 ， 若 需要 则 推送 相关 广告 。 在 线 下 领域 ， 永 旺 商场 很 时 之 前 就 
有 类 似 做 法 ， 当 判断 会 员 的 生活 用 品 用 完 时 ， 商 场 会 电话 联系 会 
员 询问 是 否 需要 继续 购买 该 生活 用 品 。 
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(5) 部 分 城市 的 地 铁 开 始 支持 手机 刷卡 ， 后 续 可 以 根据 用 户 
上 下 班 入 站 、 出 站 的 规律 ， 提 前 一 站 告知 用 户 做 好 准备 。 生 活 中 
很 多 市 民 坐 地 铁 时 都 会 玩 手机 看 视频 ， 有 些 会 提前 几 站 开始 张望 
留意 现在 地 铁 到 哪 ， 有 些 则 在 突然 知道 到 站 后 立刻 跑 出 去 ， 有 些 
甚至 太 入 迷 于 手机 导致 坐 过 站 。 提 前 一 站 告知 用 户 准备 下 车 ， 能 
较 好 提高 乘坐 地 铁 的 体验 。 





开始 考虑 小 众 需求 ， 设 置 流程 分 支 

由 于 设计 师 无 法 满足 全 部 用 户 的 需求 ， 为 了 更 好 地 服务 大 众 
群体 ， 只 好 选取 大 众 需 求 进行 设计 ， 并 将 大 部 分 用 户 行为 化 繁 为 
简 ， 将 产品 设计 为 统一 固定 的 流程 。 但 固定 的 流程 不 一 定 就 能 很 
好 地 满足 用 户 的 需求 。 以 常见 的 电影 售票 应 用 为 例 ， 如 果 将 售票 
应 用 比喻 成 售票 员 ， 有 可 能 会 发 生 如 下 对 话 : 

用 户 : 5 一 7 点 之 间 有 什么 电影 可 以 看 ? 

售票 员 : 你 是 不 是 先 选 个 电影 院 ? 

用 户 : 那 就 选 附近 的 吧 。 

售票 员 : 附近 有 两 家 。 

用 户 : 那 就 选 最 近 那 一 家 。 那 5 一 7 点 有 什么 电影 可 以 看 ? 

票 员 : 你 应 该 先 选 看 哪 部 电影 ， 再 看 看 它 有 没有 5 一 7 点 场 


用 户 ，.……- 
其 实 售票 应 用 完全 可 以 通过 筛选 后 ， 将 全 市 5 一 7 点 上 映 的 电 
影 告 诉 用 户 ， 用 户 再 根据 自己 的 状况 选择 影院 。 但 是 现在 的 售票 
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应 用 做 不 到 这 一 点 。 固 定 流程 在 一 定 程度 上 满足 了 大 部 分 用 户 的 
需求 ， 但 购 票 体验 不 一 定 是 最 佳 的 ， 因 为 固定 流程 无 法 预测 用 户 
优先 考虑 什么 , 是 先 选 时 间 还 是 先 选 地 点 ? 还 是 先 考虑 电影 类 型 ? 
这 也 导致 前 几 年 不 同 购 票 应 用 有 些 优先 选择 电影 院 ， 有 些 优先 选 
择 电影 ， 其 实 这 些 购 票 流 程 都 是 合理 的 ， 只 不 过 有 的 流程 会 有 更 
多 用 户 选 择 。 

刚刚 的 例子 算 不 算 伪 需 求 ? 还 真 不 是 , 这 只 是 小 众 需求 而 已 。 
现在 很 多 做 不 出 的 小 众 需求 被 认为 是 伪 需 求 , 这 种 理解 是 片面 的 。 
因为 “ 千 人 干 面 ”， 每 个 人 都 有 自己 独特 的 需求 ， 往 往 这 些小 众 
的 个 性 化 需求 ， 才 是 人 工 智 能 时 代 设计 师 需 要 解决 的 。 

在 未 来 ， 固 定 流程 会 很 难 满足 用 户 的 需求 ， 因 为 用 户 的 思维 
是 活跃 不 固定 的 。 在 做 产品 设计 时 ， 应 考虑 各 种 大 众 、 小 众 场景 
的 存在 ， 并 将 每 个 流程 模块 化 ,方便 管理 和 调用 。 只 要 满足 条 件 ， 
每 个 支流 程 将 有 可 能 成 为 主流 程 。 这 其 中 最 考验 交互 设计 师 能 力 
的 一 点 是 ， 产 品 的 模块 之 间 如 何 做 到 无 颖 切换 ， 避 免 出 现 异常 。 











结合 语音 用 户 界 面 一 起 设计 流程 

在 很 多 方面 语音 用 户 界 面 (Voice User Interface，VUI) 的 效 
率 都 远 高 于 图 形 用 户 界面 (Graphical User Interface，GUI) ， 例 
如 设置 闹钟 、 查 看 天 气 等 操作 命令 。VUI 和 GUI 的 结合 已 经 不 是 
新 鲜 事 ， 例 如 Siri、Google Assistant、Cortana、Bixby， 以 及 最 近 
推出 的 Alexa 屏幕 版 Echo Show。 在 GUI 的 基础 上 增加 VUI 有 助 
于 简化 整个 导航 的 交互 ， 可 以 做 到 无 直接 关系 页 面 的 跳 转 ， 例 如 
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以 命令 的 形式 导航 去 其 他 应 用 的 某 个 页 面 。 在 VUI 的 基础 上 增加 
GUI 可 以 使 选择 、 确 认 等 操作 得 以 简化 ， 尤 其 是 用 Echo Show 进 
行 购物 时 。 


5.5 从 GUI 到 VUI 


为 什么 要 将 GUI 转换 为 VUI ? 原因 有 以 下 两 点 ; @@ 现 有 互联 
网 的 绝 大 部 分 内 容 和 数据 都 与 GUI 的 信息 架构 和 代码 有 关 ， 所 以 
我 们 没有 必要 为 两 个 界面 做 两 套 内 容 ; @ 这 有 助 于 人 工 智 能 助手 
的 发 展 。 如 果 我 们 要 将 GUI 内 容 转 换 为 VUI 内 容 ， 必 须 简化 当前 
信息 ， 使 信息 压缩 为 200 ~ 300 字 每 分 钟 或 者 3 ~ 5 字 每 秒 。 

目前 的 人 工 智 能 还 无 法 实现 图 片 理解 、 情 境 感 知 等 技术 ， 要 
将 大 部 分 GUI 内 容 自动 压缩 并 转换 成 自然 语言 绝 非 易 事 ， 所 以 需 
要 人 为 制定 一 些 转 换 策略 。 

在 转换 策略 上 我 们 可 以 借鉴 成 熟 的 无 障碍 规范 指南 一 -ally， 
其 部 分 内 容 是 为 视 障 人 士 提供 帮助 的 ， 可 以 将 界面 内 容 转 换 为 声 
音 内 容 ， 有 以 下 三 个 准则 可 供 借鉴 : 

(1) 可 感知 性 : 信息 和 用 户 界面 组 件 必须 以 可 感知 的 方式 呈 


(2) 适应 性 : 创建 可 用 不 同方 式 呈 现 的 内 容 (如 简单 的 布 
局 ) ， 而 不 会 丢失 信息 或 结构 。 
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(3) 可 导航 性 : 提供 帮助 用 户 导航 、 查 找 内 容 并 确定 其 位 置 
的 方法 。 

解释 : 

(1) 在 可 感知 性 下 面 有 一 条 非常 重要 的 准则 : 为 所 有 非 文本 
内 容 例 如 图 片 、 按 钮 等 提供 替代 文本 ， 使 其 可 以 转化 为 人 们 需要 
的 其 他 形式 。 现 在 的 通用 做 法 是 为 图 片 、 按 钮 等 非 文 本 内 容 增 加 
描述 性 内 容 ， 例 如 在 img 标签 上 增加 alt 属性 ， 在 input button 标 
签 上 增加 name 属性 。 开 启 无 障碍 设置 后 ， 视 障 人 士 通过 触摸 相 
关 位 置 ， 系 统 会 将 属性 里 的 文字 朗读 出 来 。 

以 京东 的 广告 为 例 ， 应 该 在 alt 属性 上 加 上 简洁 的 内 容 “12 
月 14 日 360 手机 N6 系列 最 高 减 600 元 ”， 当 VUI 阅读 该 内 容 时 
可 以 将 广告 重点 朗读 出 来 。 








高 引 全 轴 公 | 


N6 系 列 独家 首发 八 撤 券 最 高 减 600 2 


A EL 





京东 广告 


在 这 里 我 有 一 个 新 的 想法 ， 以 下 图 为 例 : 粉红 色 区 域 为 一 
小 模块 ， 图 片 、 副 标题 、 时 间 和 作者 等 信息 对 于 必须 简化 信息 的 
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VUI 来 说 都 不 是 必要 人 信息。 那么， 是 否 可 以 在 div 标签 上 增加 一 
个 “标题 ”属性 ， 当 VUI 阅读 到 该 div 时 可 以 直接 阅读 该 属性 的 
内 容 ， 例 如 标题 内 容 ， 如 果 用 户 对 作者 感 兴趣 ， 可 以 通过 对 话 的 
形式 获取 作者 信息 。 


三 大 运营 商 年 中 考 : 传统 业务 低 价 竞争 ， 抢 跑 5G 赛 道 








4 Pe 
闻 底 迭 国内 火锅 市 场 快速 扩张 ， 海 底 捞 终 要 被 “ 吃 " 到 上 市 。 


36 筷 的 朋友 们 - 7 分 钟 前 四 餐饮 ， 金融 


36Kr 官网 


(2) 以 淘宝 为 例 ， 下 图 的 内 容 普 通 人 花 几 秒 钟 就 可 以 看 完 ; 
如 果 以 VUI 的 形式 进行 交互 , 那么 首先 VUI 不 知道 从 哪 开 始 读 起 ， 
其 次 是 用 户 没 有 耐心 听 完 全 部 内 容 。 为 什么 ? 因为 GUI 的 结构 有 
横 、 纵 向 两 个 维度 ，VUI 结构 只 有 一 个 维度 ， 用 户 在 GUI 上 的 阅 
读 顺 序 无 法 直接 迁移 到 VUI 上 ， 所 以 ally 希望 页 面 设计 时 可 以 
采用 简单 的 布局 ，GUI 和 VUI 采 用 相同 的 结构 ， 避 人 免 丢 失信 息 或 
结构 。 


TO 
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在 可 导航 性 上 ，ally 希望 网 页 提供 一 种 机 制 ， 可 以 跳 过 在 多 
个 网 页 中 重复 出 现 的 内 容 模块 。 在 这 里 我 也 有 新 的 想法 : 可 以 直 
接 跳 过 无 须 朗 读 的 内 容 模块 ， 例 如 淘宝 的 导航 、 主 题 市 场 、 登 录 
模块 ， 因 为 用 户 使 用 淘宝 VUI 主要 需求 为 搜索 物品 和 获取 优惠 信 
息 。 同 理 ， 是 不 是 可 以 在 div 标签 上 增加 一 个 “ 跳 过 ”属性 ， 当 
VUI 阅读 到 该 div 时 可 以 直接 跳 过 ， 当 用 户 有 需求 时 ， 可 以 通过 
对 话 的 形式 对 该 div 里 的 内 容 进行 交互 。 

最 后 我 还 有 另外 一 个 想法 : 是 否 可 以 为 大 段 内 容 如 新 闻 、 介 
绍 等 增加 “文本 摘要 ”属性 ， 当 VUI 阅读 到 该 标签 式 ， 自 动 使 用 
文本 摘要 功能 。 

结合 以 上 三 点 思考 ，GUI 在 转换 为 VUI 时 以 “概括 ”“ 跳 
过 ”的 方式 可 以 大 大 地 简化 信息 ， 使 VUI 拥 有 一 个 良好 的 体 
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验 。 以 上 “标题 ”“ 跳 过 ”和 “文本 摘要 ”三 个 属性 需要 W3C、 
Google、 苹 果 等 组 织 统一 制定 标准 。 

人 工 智 能 时 代 GUI 和 VUI 的 发 展会 越 来 越 快 ， 研 究 和 探索 它 
们 是 一 件 非 常 有 趣 的 事情 。 我 认为 在 未 来 几 年 里 ， 个 人 智能 助手 
的 成 熟 会 使 VUI 和 GUI 的 结合 越 来 越 紧密 ， 它 一 定 会 直接 影响 到 
未 来 几 年 移动 交互 的 发 展 。 





WW 
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未 来 五 年 后 的 设计 
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未 来 五 年 里 将 有 两 项 技术 颠覆 用 户 的 生活 。 一 项 是 量子 计算 ， 
它 将 为 云端 和 终端 提供 更 快 的 运算 速度 和 更 强 的 运算 能 力 ， 另 外 
一 项 是 5G, 它 将 革新 现 有 的 带宽 容量 , 实现 海量 数据 的 实时 传输 。 
两 项 技术 都 会 直接 推动 AI 更 快 地 发 展 和 落地 ， 实 现 数 字 世 界 和 物 
理 世 界 的 融合 。 

中 国正 在 往 发 达 国家 努力 人 靠近， 而 发 达 国 家 的 第 三 产业 即 服 
务 业 比较 兴盛 ， 包 括 交通 运输 业 、 商 业 、 餐 饮 业 、 金 融 业 、 教 育 
产业 、 公 共 服 务 等 ， 所 以 中 国 在 未 来 五 年 的 服务 业 将 有 明显 的 提 
升 。AI 也 将 助力 中 国 服务 业 的 发 展 ， 其 技术 扩散 的 速度 将 会 逐渐 
加 快 ， 各 个 领域 都 能 运用 人 工 智 能 、 物 联网 、 虚 拟 现实 和 增强 现 
实 等 最 新 的 技术 。 在 未 来 , 更 多 领域 以 及 行业 需要 用 到 界面 设计 、 
人 机 交互 设计 等 技能 ， 各 行 各 业 的 设计 师 需 要 掌握 以 上 技能 才能 
更 好 地 服务 当前 业务 。 下 文 尝试 以 智慧 城市 设计 、 新 零售 设计 、 
家 的 设计 三 个 方向 为 例 ， 描 绘 未 来 的 设计 是 怎样 的 。 





6.1 智慧 城市 设计 


在 很 时 以前， 城市 的 规划 和 发 展 都 由 统治 者 决定 ， 每 座 城市 
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的 总 设计 师 需要 对 整个 城市 有 详细 的 规划 ， 例 如 发 生 战 争 时 如 何 
防范 ， 以 及 它 的 人 口 规模 、 地 理 环境 、 周 边 信息 等 ， 可 以 说 城市 
规划 需要 结合 各 种 数据 进行 设计 ， 如 果 设 计 不 当 将 会 对 未 来 整个 
城市 发 展 以 及 市 民生 活体 验 带 来 严重 的 影响 。 例 如 ， 中 国 的 下 水 
道 系统 设计 整体 较 差 ， 导致 很 多 城市 在 暴雨 天 气 下 瞬间 变 成 一 个 
个 “水 上 威尼斯 ”。 

城市 设计 更 多 需要 处 理 大 规模 复杂 的 信息 ， 在 这 方面 AI 比 人 
类 更 有 优势 。 以 城市 交通 规划 为 例 ， 在 2017 年 的 云 栖 大 会 上 ， 阿 
里 提出 的 智能 治理 城市 方案 正式 发 布 ， 城 市 大 脑 1.0 接管 了 杭州 
128 个 信号 灯 路 口 ， 试 点 区 域 通行 时 间 减 少 15.3%， 高 架 道路 出 行 
时 间 节 省 4.6 分 钟 。 在 主 城区 ， 城 市 大 脑 日 均 事件 报警 为 500 次 
以 上 , 准确 率 达 92%; 在 萧山 ，120 救护 车 到 达 现 场 时 间 缩 短 一 半 。 
城市 大 脑 的 “天 曜 ”系统 能 365 天 24 小 时 通过 已 有 的 街头 摄像 头 
无 休 巡 逻 ， 释 放 和 警力 200 余 名 。 

在 未 来 ， 人 工 智 能 将 逐步 落地 到 智慧 交通 管理 上 ， 无 人 驾驶 
能 有 效 解决 人 身 安 全 存在 风险 、 资 源 利 用 率 低 和 交通 拥堵 等 问题 ， 
AI 监控 摄像 头 和 无 人 机 将 替代 交警 巡 罗 实现 全 自动 化 管理 ， 交 通 
数据 有 了 更 大 的 提升 ， 用 户 也 将 得 到 更 好 的 出 行 服务 体验 。 除 了 
城市 交通 ， 城 市 能 源 、 供 水 、 建 筑 等 基础 设施 的 信息 也 会 在 云端 
被 全 部 数字 化 ， 更 多 的 数字 监控 平台 将 接管 城市 管理 的 工作 。 

在 未 来 ， 由 于 会 有 更 多 的 数字 平台 进行 城市 管理 ， 因 此 需要 
有 更 多 的 设计 师 间接 参与 到 智能 城市 管理 工作 中 。 每 一 个 操作 流 
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藉 





程 的 设计 都 需要 非常 谨慎 ， 因 为 一 个 设计 出 问题 ， 可 能 导致 管理 
人 员 出 错 并 间接 导致 数字 平台 出 错 ， 使 城市 出 现 各 种 异常 ， 给 市 
民 带 来 生活 上 的 不 便 。 关 于 平台 设计 不 当 导致 悲剧 发 生 ， 有 一 个 
经 典 的 案例 9。 在 1988 年 的 波斯 湾 ， 正 在 巡航 的 美国 海军 巡洋舰 
“ 文 森 斯 号 ” 收 到 有 不 明 飞 机 人 迫近 的 信息 ， 但 是 从 雷达 屏 上 很 难 
区 分 这 架 飞 机 是 在 仆 升 还 是 俯冲 。 军 舰 上 的 人 错误 地 判断 这 架 飞 
机 正在 向 他 们 俯冲 ， 因 此 认为 是 一 架 逼 近 的 敌 机 。 同 时 ， 飞 机 上 
的 驾驶 人 员 又 没有 回应 军舰 发 出 的 警告 ， 舰 上 人 员 的 生命 悬 于 一 
线 ， 时 间 十 分 紧迫 ， 舰 长 决定 向 敌 机 开火 ， 士 兵 们 毫 不 犹豫 地 执 
行 了 舰 长 的 决定 。 非 常 翡 哀 的 是 ， 那 架 飞 机 是 一 架 伊朗 的 民航 飞 
机 ， 该 飞机 当时 并 不 是 俯冲 ， 而 是 在 仆 升 的 阶段 。 正 因为 雷达 屏 
的 设计 和 表意 不 当 , 以 及 形势 混乱 致使 美国 海军 做 出 了 错误 判断 ， 
最 终 导致 数 百 人 的 丧生 。 因 此 设计 数字 监控 平台 的 重任 将 落 到 设 
计 师 身上 ， 设 计 师 一 定 要 非常 熟悉 人 因 学 和 相关 的 业务 。 

关于 平台 和 系统 设计 ， 相 信 大 家 对 《钢铁 侠 》 里 的 Jarvis 系 
统 并 不 陌生 ， 它 主要 通过 数字 李 生 技术 (Digital Twin) 实时 将 钢 
铁 侠 盔 甲 的 状态 以 AR 的 形式 展现 给 Tony Stark。 数 字 挛 生 技术 是 
一 种 将 物理 世界 映射 到 虚拟 世界 的 仿真 技术 ， 它 利用 物理 模型 、 
传感器 更 新 、 运 行 历史 等 数据 ， 集 成 多 学 科 、 多 物理 量 、 多 尺度 、 
多 概率 的 仿真 技术 ， 将 物理 世界 的 信息 实时 同步 至 虚拟 世界 ， 有 
助 于 计算 机 实时 管理 、 模 拟 和 预测 发 现 物理 世界 中 的 问题 。 人 主 











Q@ ”该 案例 来 自 C.D. 威 表 斯 和 J.D. 李 所 著 的 《人 因 工 程 学 导论 》 第 一 章 。 
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动 发 现 问题 变 成 问题 主动 找 人 ， 数 字 挛 生 技术 简化 了 大 规模 复杂 
系统 的 监控 流程 ， 同 时 ， 将 管理 交 给 计算 机 可 以 降低 复杂 系统 的 
学 习 成 本 , 便于 更 早 地 发 现 问题 并 提前 进行 处 理 。 在 现实 生活 中 ， 
美国 国防 部 在 很 早 之 前 就 已 经 在 使 用 数字 挛 生 技术 了 ， 该 技术 被 
用 于 航空 航天 飞行 器 的 健康 维护 与 保障 上 。 美 国 国防 部 在 数字 空 
间 建 立 真实 飞机 的 模型 ， 并 通过 传感器 实现 与 飞机 真实 状态 完 

同步 ， 这 样 每 次 飞行 后 ， 根 据 结构 现 有 情况 和 过 往 载荷 ， 及 时 分 
析 评 估 是 否 需要 维修 ， 能 否 承受 下 次 的 任务 载荷 等 。 




















《钢铁 侠 》 电 影 中 数字 挛 生 以 AR 技术 展现 


相信 在 不 久 的 将 来 ， 数 字 监 控 平 台 、 数 字 杰 生还 有 AR 等 技 
术 将 逐步 落地 到 智慧 城市 的 建设 上 ， 整 个 智慧 城市 管理 将 变 得 更 
直观 和 方便 ， 有 助 于 城市 管理 者 提前 管理 和 控制 风险 ， 降 低 城 市 
出 现 混乱 的 概率 。 对 设计 师 来 说 ， 未 来 数字 平台 的 设计 将 会 变 得 
更 有 趣 和 更 具 挑 战 性 。 
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6.2 ”新 零售 设计 


未 来 的 购物 商城 有 两 点 可 以 改进 : 第 一 点 是 如 何 与 其 他 商家 
合作 共同 盈利 ， 第 二 点 是 如 何 通过 服务 设计 和 技术 改善 自己 的 服 
务 ， 吸 引 更 多 消费 者 。 


6.2.1 打通 商城 闭环 ， 共 同 盈 利 


第 一 点 大 家 可 能 会 觉得 奇怪 ， 是 指 要 和 竞争 对 手 合 作 吗 ? 不 
是 的 , 而 是 和 其 他 领域 的 商家 一 起 合作 , 实现 “有 钱 大 家 一 起 赚 ”。 

从 团购 模式 的 百 “ 团 ”大 战 开始 ， 我 认为 整个 中 国 消费 行业 
出 现 了 一 个 很 大 的 问题 ， 大 家 都 通过 团购 公司 的 补贴 降低 自己 的 
价格 ， 从 而 通过 低 价 吸引 用 户 的 眼球 。 困 购 公 司 之 间 的 恶性 竞争 
和 疯狂 补贴 导致 严重 烧 钱 ， 最 终 剩 下 美 团 点 评 和 阿里 巴巴 两 个 巨 
头 还 在 相互 竞争 。 当 巨头 不 再 补贴 时 ， 很 多 依赖 补贴 的 商家 很 快 
就 支撑 不 下 去 最 终 倒 闭 ， 还 有 一 些 商家 自欺欺人 ， 将 原价 199 元 
的 价格 抬 高 到 399 元 ， 再 说 目前 是 优惠 价 199 元 ， 欺 骗 消 费 者 。 

如 果 说 之 前 的 补贴 是 单 点 的 补贴 ， 当 团购 公司 的 补贴 消失 时 ， 
这 个 单 点 也 会 消失 。 那 么 能 不 能 考虑 把 多 个 单 点 连接 起 来 ， 让 每 





个 点 服务 每 个 点 ， 使 每 个 单 点 的 存活 性 加 强 ? 这 样 一 来 当 团购 公 
司 的 补贴 消失 时 ， 每 个 单 点 都 能 扶持 其 他 单 点 。 


以 我 周末 和 逛 商城 的 场景 为 例 ， 首 先 我 会 提前 购买 商城 影院 的 
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影 票 ， 快 到 放映 开始 时 打车 去 购物 商城 ， 取 票 前 先 买 一 杯 饮料 
再 进 场 。 看 完 电影 已 经 到 吃饭 的 时 间 了 ， 这 时 候 我 会 考虑 在 哪 吃 
饭 ， 然 后 翻 了 好 久 大 众 点 评 才 能 决定 。 

以 下 是 我 的 设想 : 既然 要 补贴 ， 那 就 实现 整个 商业 闭环 的 补贴 。 
例如 ， 可 以 在 消费 者 买 完 电 影 票 时 推送 饮料 和 餐饮 店 的 优惠 券 ; 
当 消费 者 购买 了 餐饮 店 的 团购 券 ， 可 以 推送 一 些 服饰 类 优惠 券 ; 
而 当 一 些 女性 消费 者 购买 完 衣服 时 ， 再 推送 一 些 甜品 店 优惠 券 。 

商家 之 间 相 互 推送 优惠 券 促 进 用 户 消费 的 机 制 利用 了 以 下 两 
点 : 中 打折 这 个 概念 对 很 多 消费 者 来 说 具有 较 强 的 吸引 力 ，@) 将 
用 户主 动 查找 优惠 券 〈 使 用 频率 低 、 寻 找 时 间 长 ) 转换 为 商家 主 
动 推 送 优惠 券 〈 每 次 消费 完 都 有 相关 的 优惠 券 推 送 ， 使 用 频率 会 
上 升 ， 寻 找 时 间 降 低 ) 。 利 用 这 两 点 ， 不 仅 能 把 整个 商城 的 闭环 
打通 ， 而 且 能 提高 用 户 在 商城 的 消费 。 

这 个 设想 也 符合 第 5 章 提 到 的 “以 用 户 经 历 为 中 心 的 设 
计 ”。 后 面 我 们 做 商业 设计 时 ， 就 要 考虑 消费 者 在 商城 的 经 历 是 
什么 ， 以 及 如 何 利用 这 个 经 历 优化 设计 。 


6.2.2 ”如 何 通 过 服务 设计 和 技术 改善 自己 的 服务 


其 实 如 何 改善 自己 的 门店 和 服务 也 是 非常 重要 的 。 消 费 者 的 


设备 互动 、 离 店 ， 设 法 将 一 名 路 人 转换 成 消费 者 ， 其 实 跟 “ 漏 斗 
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模型 ”的 使 用 差不多 ， 我 们 可 以 结合 数据 分 析 、 服 务 设计 和 人 工 
智能 等 方法 为 用 户 带 来 更 好 的 体验 。 

进 店 前 

当 用 户 在 商城 闲逛 看 到 感 兴 趣 的 品牌 或 者 商品 时 会 在 店铺 门 
前 停 下 来 。 那 么 ， 如 何 吸 引 消费 者 观察 店 里 的 商品 ? 可 以 考虑 用 
各 种 办 法 将 消费 者 引进 店内 ， 除 了 派发 传单 或 者 优惠 券 ， 还 能 在 
商城 内 投放 商家 广告 和 1logo， 甚 至 这 个 logo 可 以 是 AR 识别 的 载 
体 ， 能 指向 该 商户 所 在 位 置 。 在 门店 橱窗 ， 还 可 以 通过 大 屏 电 视 
播放 短视 频 和 图 片 的 方式 告诉 用 户 最 新 推出 的 产品 以 及 打折 信息 ， 
甚至 可 以 考虑 加 入 计算 机 视觉 技术 识别 哪些 路 过 的 消费 者 在 门店 
前 出 现 的 次 数 最 多 或 者 停留 时 间 最 长 ， 哪 些 消费 者 曾经 在 店 里 或 
者 其 他 连锁 店 消费 过 ， 从 而 辅助 店员 更 有 目标 地 指引 消费 者 到 店 
里 消费 。 

进入 门店 

在 2013 年 苹果 就 提出 了 ibeacon 的 概念 ， 店 家 可 以 通过 
ibeacon 向 消费 者 手机 推送 一 些 商品 信息 ， 从 而 促进 消费 。 但 
ibeacon 一 直 没 流行 起 来 ， 这 是 有 原因 的 。 消 费 者 在 闲逛 的 时 候 是 
不 看 手机 的 ， 如 果 一 直 推 送 会 强迫 消费 者 经 常 拿 起 手机 看 信息 ， 
这 时 消费 者 究竟 是 该 闲逛 还 是 看 手机 ? 所 以 应 该 用 更 合适 的 方式 
引导 消费 者 进行 消费 。 例 如 ， 只 有 当 消 费 者 走 进门 店 后 ， 计 算 机 
才 会 自动 推送 相关 的 优惠 信息 给 用 户 。 还 有 一 种 比较 有 趣 的 做 法 ， 
我 们 都 听 过 沃尔玛 啤酒 和 尿布 的 经 典 营销 案例 ， 如 果 能 通过 数据 
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挖掘 的 方式 找到 每 个 商品 之 间 的 关系 ， 再 通过 计算 机 视觉 技术 掌 
握 消 费 者 拿 了 什么 商品 ， 这 时 就 可 以 及 时 地 向 用 户 推荐 相关 联 的 
商品 ， 或 许 能 提升 全 品类 商品 的 销售 量 。 





与 店员 或 导购 设备 互动 

店员 或 导购 设备 都 能 为 消费 者 提供 更 好 的 服务 和 建议 ， 是 整 
个 服务 设计 闭环 中 最 重要 的 一 部 分 。 当 前 线 下 零售 最 大 的 数据 缺 
失 就 是 不 知道 消费 者 在 挑选 过 程 中 ， 接 触 过 哪些 商品 ， 挑 选 的 过 
程 是 什么 。 在 人 工 智 能 的 帮助 下 ， 当 我 们 用 计算 机 视觉 技术 发 现 
部 分 消费 者 在 门店 里 长 时 间 逗 留 却 没 消费 的 时 候 ， 可 以 提醒 相关 
的 店员 走 过 去 为 这 些 消费 者 提供 帮助 ， 如 果 消 费 者 曾经 在 店 里 
消费 过 ， 计 算 机 还 可 以 根据 该 名 消费 者 的 用 户 画 像 判 断 他 喜欢 
的 类 型 是 什么 ， 然 后 让 店员 为 消费 者 推荐 更 多 商品 。 如 果 我 们 
能 把 整个 购物 中 心 的 数据 进行 整合 ， 那 么 消费 者 的 用 户 画 像 将 会 
准确 得 多 。 

关于 导购 设备 ， 可 以 参考 以 下 例子 。 在 2018 年 7 月 ， 阿 里 巴 
巴 与 国际 知名 服饰 品牌 Guess 合作 ， 在 香港 落地 了 全 世界 第 一 
人 工 智能 服饰 店 一 一 “FashionAI 概念 店 ”。FashionAI 学 习 了 50 
万 套 来 自 淘宝 达 人 的 时 尚 穿 搭 ， 归 纳 出 一 整套 理解 时 尚 和 美的 方 
法 论 ， 可 以 为 女性 消费 者 提供 合适 的 穿 搭建 议 。 消 费 者 只 需要 在 
概念 店 门口 扫 码 登录 ， 即 可 开始 自己 的 购物 之 旅 。 在 店 里 ， 当 消 
费 者 随意 拿 起 任何 一 件 衣服 ， 货 架 边 的 试 衣 镜 就 会 感应 到 它 并 给 
出 若干 种 搭配 组 合 ， 同 时 消费 者 会 发 现 他 们 曾经 购买 过 的 衣服 、 
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鞋子 也 会 显示 在 试 衣 镜 上 ，FashionAI 会 根据 消费 者 的 在 淘宝 /天 
猫 的 历史 消费 记录 ， 为 消费 者 提供 相关 的 穿 搭 建议 。 当 消费 者 在 
试 衣 镜 上 选 好 尺码 、 型 号 并 确认 试 衣 后 ， 就 可 以 直接 到 试 衣 间 等 
待 ， 售 货 员 会 把 相应 的 衣服 拿 到 试 衣 间 ; 当 消 费 者 通过 扫 码 的 方 
式 确 认购 买 后 ， 可 以 选择 在 店 里 提货 或 者 快递 到 家 ， 然 后 继续 开 
心地 和 逛 下 一 家 商店 。 


























FashionAl 概念 店 


离 店 
当 消 费 者 要 离开 门店 的 时 候 ， 可 以 请 求 消费 者 将 这 次 消费 体 
验 分 享 给 朋友 , 或 者 让 消费 者 对 这 次 消费 体验 进行 评分 。 相 应 地 ， 
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我 们 还 可 以 送出 更 优惠 的 打折 券 期 待 消费 者 下 次 光临 ， 或 者 送出 
带 有 品牌 印记 的 小 礼品 。 

在 未 来 的 整个 消费 过 程 中 ， 商 家 可 以 在 人 工 智能 、 大 数据 分 
析 以 及 服务 设计 的 基础 上 ， 对 自身 的 运营 数据 进行 更 精准 的 店 
铺 运 营 分 析 和 消费 者 分 析 ， 从 而 预测 自己 商品 的 销量 变化 趋 
势 ， 结 合 店 铺 自身 情况 提前 调整 备货 。 如 何在 整个 服务 链 路 上 
增加 入 工 智能 技术 和 大 数据 分 析 技 术 ， 也 是 设计 师 在 设计 流程 时 
需要 考虑 的 。 


6.3 ”家 的 设计 


不 知道 大 家 还 记 不 记得 《 哈 利 . 波 特 》 里 的 画像 “ 胖 夫 
人 ”? 她 不 仅 能 说 话 ， 还 能 串门 到 其 他 壁画 里 聊天 。 在 现实 世界 
中 ，2015 年 一 款 名 为 Atmoph Window 的 智能 壁画 登陆 众 筹 网 站 
Kickstarter。 从 外 观 上 来 看 ， 这 款 产 品 只 是 一 幅 简单 的 壁画 ， 但 是 
它 的 内 容 能 随意 切换 ， 还 能 发 出 配合 壁画 内 容 的 真实 声音 。 例 如 ， 
当 Atmoph Window 上 显示 的 是 曼哈顿 繁华 的 街道 ， 其 就 能 够 真实 
呈现 车 水 马龙 的 喧嚣， 如 果 显 示 的 是 壮观 的 尼亚加拉 瀑布 ， 则 能 
够 发 出 水 泻 千 尺 撞击 地 面 的 声响 …… 你 只 需要 静 静 地 坐 在 Atmoph 
Window 前 ， 它 就 能 带 你 看 遍 人 世 美景 。 
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Atmoph Window 


除了 画像 “ 胖 夫 人 ”,“ 韦 斯 莱 时 钟 ” 也 成 了 现实 。 当 哈 利 
第 一 次 去 罗 恩 家 的 时 候 ， 在 陋 居 客厅 里 看 到 了 墙 上 挂 的 “ 韦 斯 莱 
时 钟 ”， 时 钟 上 没有 数字 ， 它 的 每 个 指针 指向 家 族 的 一 个 成 员 ， 
罗 恩 的 妈妈 韦 斯 莱 夫 人 用 它 来 提醒 自己 还 有 什么 事 没完 成 ， 同 时 
关注 家 人 在 做 什么 。2017 年 众 筹 网 站 Kickstarter 出 现 了 一 款 名 叫 
Eta Clock 的 时 钟 ， 它 可 以 实时 显示 用 户 的 位 置 。 表 盘 上 每 一 个 彩 
色 指 针 都 代表 了 一 位 用 户 所 在 意 的 人 ， 而 表盘 的 数字 部 分 则 用 于 
显示 目的 地 ， 例 如 “工作 场所 ”“ 健 身 房 ”或 者 “学 校 ”。 当 然 
这 个 时 钟 靠 的 不 是 魔法 ， 而 是 手机 GPS 定位 追踪 ， 通 过 App 将 用 
户 的 地 理 位 置信 息 发 送 到 Eta Clock 上 ， 对 应 的 指针 则 会 自动 转动 
改变 指示 位 置 。 这 款 神奇 的 “ 韦 斯 莱 时 钟 ”预计 将 在 2018 年 年 内 
交 货 。 
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观看 视频 了 解 更 多 千 @ 恰 


Eta Clock 


以 上 两 个 例子 可 以 说 是 我 小 时 候 对 神奇 的 魔法 世界 最 有 趣 、 
最 直观 的 印象 ， 但 彼 时 它们 还 不 太 可 能 出 现在 现实 生活 中 。 然 而 
在 今天 ， 科 技 的 发 展 已 经 到 了 能 够 取代 甚至 超越 魔法 的 境界 ， 我 
们 能 把 类 似 的 家 居 装 饰 实现 ， 放 到 温馨 的 家 里 。 

墙壁 是 家 中 不 可 或 缺 的 元 素 ， 我 们 每 天 都 生活 在 有 四 墙 墙 的 
房间 里 ， 通 常 我 们 会 挂 上 照片 、 海 报 、 名 画 等 方式 来 装饰 白 墙 ， 
但 很 多 人 装饰 一 次 后 就 很 少 再 更 换 装 饰品 了 ， 如 何 让 白 墙 充满 生 
命 力 ? 

我 们 换 一 个 角度 思考 ， 如 果 能 够 通过 增强 现实 的 方式 来 装饰 
墙壁 会 不 会 更 有 趣 一 点 ? 墙 是 已 知 的 实体 ， 只 需要 在 上 面 投放 虚 
拟 影像 ， 就 能 使 其 随时 发 生变 化 。 用 投影 仪 来 增强 效果 是 马上 能 
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想到 的 ， 它 还 有 一 个 优势 ， 只 要 设计 稿 里 的 边界 用 的 是 黑色 ， 那 
么 它 投放 出 来 的 效果 就 是 无 边界 的 ， 能 够 完美 和 白 墙 贴 合 在 一 起 
(投影 仪 无 法 投射 出 黑光 ， 所 以 设计 稿 里 的 黑色 代表 了 白 墙 原本 
的 颜色 ) 。 这 时 就 可 以 充分 发 挥 我 们 的 想象 力 了 : 可 以 把 白 墙 变 
成 一 扁 窗 户 , 观赏 外 面 樱花 飘落 的 公园 ， 可 以 在 墙 上 挂 一 副 达 。 芬 
奇 的 《 蒙 娜 丽 莎 》， 偶 尔 她 还 会 向 你 瞬 眼 或 者 跳 起 舞 来 ;还 可 以 


























把 自己 家 小 孩 的 照片 组 合成 一 面 照片 墙 ， 照 片 的 切换 能 让 你 回顾 
孩子 从 婴儿 慢 慢 长 大 成 人 的 点 点 滴 滴 ， 非 常 感人 。 通 过 简单 的 投 


影 设 备 ， 就 能 让 你 的 白 墙 、 你 的 空间 拥有 魔法 ， 让 你 的 家 瞬间 充 
满 温 暖和 活力 。 





设计 图 和 现实 中 的 投影 效果 








最 近 有 不 少 智 能 投影 设备 开始 面向 用 户 发 售 ， 例 如 可 触 屏 的 
便携 式 投影 仪 Puppy Cube， 它 能 通过 空间 触 控 技术 Anytouch 把 
房间 中 的 任意 平面 (如 墙 面 、 桌 面 以 及 地 面 等 ) 投影 为 触 控 屏 ， 

















和 


| 第 6 章 未 来 五 年 后 的 设计 | 


并 可 实现 10 点 触 控 。 通 过 这 项 技术 ， 父 母 可 以 和 孩子 在 家 里 进 
行 亲 子 教育 或 者 游戏 互动 (投影 仪 还 有 一 个 好 处 是 反射 光 不 怎么 
伤 眼 ， 适 合 小 孩 使 用 ) 。 还 有 一 款 比 较 有 意思 的 投影 仪 是 外 形 酷 
似 人 台灯 的 Beam， 你 只 需要 把 它 插 放 到 人 台灯 灯 座 就 能 直接 使 用 ， 
随时 随地 享受 信息 交互 带 来 的 愉悦 。 例 如 在 厨房 做 饭 的 时 候 ， 把 
Beam 安装 在 桌 台 的 灯 座 上 ， 它 就 能 在 厨房 桌 全 投 影 食谱 ， 帮 助 你 
做 出 美味 的 菜 着 。 日 本 Vinclu 公司 开发 了 一 款 名 叫 Gatebox 的 全 
息 投影 仪 ， 可 以 投 出 一 个 专 为 宅男 定制 的 家 用 智能 化 全 息 机 器 人 
Azuma Hikari。Gatebox 除了 可 以 控制 其 他 智能 家 居 电 器 外 ， 还 能 
通过 传感器 检测 人 体 的 动作 以 及 室内 的 温度 变化 ， 用 户 可 以 通过 
语音 、 手 机 应 用 的 方式 与 Azuma 进行 交流 ， 还 可 以 通过 Azuma 
的 肢体 语言 判断 “她 ”的 情绪 ，Azuma 先进 的 交友 能 力也 使 她 更 
加 入 性 化 。 





Puppy Cube 
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Beam 





Gatebox 
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投影 技术 能 把 众多 数字 信息 映射 到 真实 世界 , 与 环境 相 结合 ， 
在 未 来 的 智慧 空间 中 一 定 会 起 到 非常 重要 的 作用 。 试 举 一 个 例子 : 
当 我 们 把 摄像 头 和 投影 仪 结合 使 用 ， 一 堵 墙 就 像 变 成 了 哆 啦 A 梦 
里 的 传送 门 ， 把 两 个 相距 十 万 八 千里 的 家 庭 连接 在 一 起 ， 帮 助 很 
多 常年 漂泊 在 外 的 年 轻 人 实现 了 多 回 家 看 看 的 愿望 。 





通过 投影 仪 和 摄像 头 看 到 亲人 


投影 仪 只 是 把 墙 当 作 屏幕 ， 我 们 再 把 脑 洞 打开 得 大 一 点 ， 能 
把 墙 当 作 触摸 屏 吗 ? 迪士尼 研究 院 与 卡耐基 梅 隆 大 学 一 起 合作 开 
发 了 一 款 大 型 内 容 感知 传 感 系统 Wallt++， 能 把 用 户 的 墙 改装 成 触 
摸 屏 。 用 户 只 需要 给 墙 刷 上 他 们 特制 的 导电 涂 层 ， 再 粉 上 白石 灰 ， 
最 后 安装 一 个 传感器 就 大 功 告 成 了 ， 而 且 看 起 来 和 普通 的 墙壁 毫 
无 差别 。Wall++ 除了 可 以 感应 识别 人 体 的 活动 状态 〈 不 触摸 也 能 
感知 ) ， 还 能 通过 捕获 空中 的 电磁 噪声 ， 检 测 到 处 于 活动 状态 的 
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设备 以 及 它们 的 位 置 ， 更 有 趣 的 是 ， 它 能 通过 跟踪 人 体 移动 来 实 
时 识别 出 你 与 智能 设备 的 交互 方式 , 例如 你 去 开 灯 或 者 玩 计 算 机 ， 
也 会 被 Wall++ 感知 到 。 有 了 智能 墙壁 能 做 什么 呢 ? 你 可 以 通过 编 
程 把 墙 变 成 各 种 开关 ， 通 过 手势 打开 灯光 或 者 解锁 门 的 密码 。 甚 
至 结合 投影 仪 你 就 可 以 直接 和 投影 在 墙 上 的 内 容 进行 互动 ， 当 把 
你 家 的 墙 变 成 了 1 : 1 的 淘宝 衣柜 ， 就 可 以 直接 看 到 最 真实 的 商品 
效果 。 在 未 来 ， 当 有 更 多 设备 进入 我 们 生活 中 ， 我 们 的 生活 也 一 
定 会 变 得 更 加 智能 和 有 趣 。 

正如 第 5 章 所 说 的 , 机 器 应 该 站 在 用 户 经 历 的 角度 进行 思考 ， 
学 会 和 其 他 设备 联动 ， 获 取 用 户 数 据 并 优化 自己 的 行为 。 通 过 
IFTTT (if this then that) 的 设计 思路 ， 能 让 每 个 机 器 发 生 连 锁 反 
应 ， 使 用 户 的 生活 更 为 方便 。 以 一 个 简单 的 生活 场景 为 例 ， 早 上 
快 到 闹钟 叫 醒 的 时 候 ， 佩 戴 在 身上 的 手 环 会 根据 用 户 的 睡眠 质量 
给 其 他 智能 硬件 发 出 信号 ， 房 间 的 灯光 开始 模拟 朝阳 的 变化 逐渐 
变 亮 %， 让 用 户 在 自然 光 的 照耀 下 自然 苏醒 ， 同 时 ， 闹 钟 根 据 手 
环 发 出 的 信息 给 出 不 同 的 铃声 叫 醒 用 户 ; 投影 仪 检 测 到 用 户 起 
床 后 ， 开 始 播放 用 户 关 注 的 内 容 ， 例 如 天 气 预 报 、 出 门 建议 、 新 
闻 等 。 

日 本 设计 大 师 原 研 哉 对 于 未 来 的 家 也 有 比较 前 卫 的 看 法 。 面 
对 日 本 少子 化 的 现象 ， 原 研 哉 认为 每 个 人 的 生活 方式 不 同 ， 都 有 
自己 的 生活 重心 ， 所 以 就 不 需要 住 在 同样 格局 的 房间 里 ， 人 们 可 








@ ” 松下、 飞利浦 、Yeelight 的 部 分 智能 灯 已 具有 灯光 唤醒 功能 。 
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以 自由 地 为 自己 量 身 定做 一 个 “住宅 的 形态 ”。 如 果 你 的 兴趣 是 
襄 饪 ， 你 可 以 把 最 大 的 预算 用 到 厨房 ， 建 一 个 以 食 为 中 心 的 家 
如 果 你 喜欢 书 ， 那 就 把 每 面 墙 都 做 成 书架 ， 让 家 像 图 书馆 一 样 收 
藏书 籍 ， 你 可 以 在 家 里 静 下 心 来 畅游 知识 的 海洋 ， 如 果 你 长 时 间 
在 外 ， 回 家 基本 是 为 了 睡觉 ， 那 就 把 重点 放 在 卧室 ， 挑 选 优质 的 
床 垫 和 被 子 , 再 装 一 个 像 电影 院 一 样 大 而 高 品质 的 影像 音响 系统 ， 
这 样 就 可 以 直接 躺 在 床上 看 电影 。 














原 研 哉 对 未 来 的 家 的 理解 


在 2012 年 , 英国 电视 台 Chanel 4 拍摄 了 《未 来 之 家 》 系 列 (可 
在 网 站 搜索 “CH4 未 来 之 家 ”进行 观看 ) ， 旨 在 通过 各 种 高 科技 
让 观众 知道 未 来 的 家 庭 生活 是 怎样 的 ， 虽 然 6 年 过 去 了 ， 但 仍 有 
很 多 高 科技 的 智能 硬件 还 没 普及 到 千 万 家 庭 中 。 

最 后 ， 你 可 能 会 问 ， 在 家 里 使 用 这 么 多 智能 硬件 不 费 电 吗 ? 
其 实在 新 能 源 的 发 展 先驱 地 德国 ， 随 处 可 见 屋顶 光伏 发 电 设备 和 
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田间 路 旁 的 风力 发 电机 在 源源 不 断 地 输出 着 电力 。2016 年 ， 以 太 
阳 能 和 风能 为 代表 的 新 能 源 发 电 在 德国 电力 的 生产 比例 已 经 超过 
30%。 由 于 新 能 源 发 电量 由 天 气 决 定 ， 如 果 天 气 太 好 反而 会 导致 
电量 存储 过 多 ， 影 响 整 个 电网 正常 运作 ， 所 以 政府 积极 鼓励 居民 
多 用 电 来 解决 这 个 问题 。 相 信 在 未 来 ,中国 也 会 普及 新 能 源 发 电 ， 
到 时 候 电费 就 不 成 问题 了 。 
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7.1 我 们 只 是 终身 学 习 者 而 已 


Shadow: 我 是 池 志 炜 ， 也 是 Shadow， 典 型 斜 杠 青年 。2008 
年 毕业 于 上 海 交通 大 学 设计 学 院 景观 设计 专业 ， 同 济 大 学 硕士 。 
现在 的 身份 是 跨 界 设计 师 ， 从 事 过 景观 设计 、 旅 游 规 划 、 房 地 
产 设计 管理 、 参 数 化 设计 、 用 户 体验 设计 、 数 据 可 视 化 设计 等 。 
同时 我 也 是 一 名 全 栈 开 发 者 ， 这 几 年 我 自学 了 深度 学 习 相 关 的 
Keras、 后 端 相关 的 Node.js 和 Python， 现在 在 设计 圈 比 较 有 名 的 
ARKIE 担任 产品 经 理 /机 器 学 习 研 究 员 ， 同 时 兼任 上 海 交 通 大 学 
景观 设计 课程 的 老师 以 及 一 些 朋友 创业 团队 的 技术 顾问 。 这 几 年 
也 在 做 自 媒 体 ， 公 众 号 叫 Mixlab 〈 微 信号 Design-AILLab) ， 知 乎 
专栏 叫 《AI 设计 修炼 指南 》， 目 前 已 经 形成 500 多 人 的 设计 师 及 
程序 员 跨 界 社 群 。 

作者 : 你 是 几时 开始 自学 开发 的 ? 为 什么 想 学 开发 ? 在 我 的 
理解 里 ， 自 学 开发 对 设计 师 来 说 不 是 一 件 容 易 的 事情 。 

Shadow: 2008 年 我 一 毕业 就 在 自学 Python 和 可 视 化 编程 ， 
在 很 多 景观 项 目 中 我 会 通过 编程 的 方式 来 调整 CAD、Sketchup 里 
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的 三 维 设计 。 在 2013 年 的 时 候 我 开始 学 习 前 端 开 发 ， 后 来 跳 模 到 
中 兴 担 任 高 级 软件 开发 工程 师 ， 主 要 通过 Node.js 来 进行 Hybrid 
App 的 开发 ，2016 年 顺手 学 习 了 React Native。 到 了 2017 年 我 换 
了 一 份 工 作 ， 在 招商 银行 做 用 户 体验 设计 ， 从 景观 设计 到 编程 开 
发 再 到 用 户 体验 设计 ， 跨 度 还 是 变 大 的 。 在 招商 银行 做 设计 的 同 
时 我 也 在 做 研发 的 工作 ， 我 想 帮 招商 银行 实现 一 个 阿里 的 鹿 班 系 
统 ， 它 能 自动 生成 各 种 Banner、 海 报 ， 所 以 我 又 自学 了 深度 学 习 
相关 的 知识 。 反 正 有 新 东西 我 就 会 尝试 去 接触 和 学 习 。 

作者 : 恬 愧 殿 愧 ， 我 一 名 计算 机 背景 出 身 的 设计 师 掌握 的 编 
程 技能 都 没有 你 多 。 你 为 什么 想 做 一 个 鹿 班 系统 出 来 ? 

Shadow: 我 希望 能 通过 智能 的 方式 去 实现 设计 。 我 在 2008 
年 做 景观 设计 的 时 候 已 经 在 做 参数 化 设计 了 。 在 2017 年 ， 我 花 了 
很 多 时 间 和 精力 来 研究 智能 化 设计 这 个 方向 。 在 2018 年 离开 招商 
银行 的 时 候 ， 我 开发 的 系统 已 经 有 一 个 可 用 的 版 本 ， 可 以 直接 看 
到 具体 的 效果 ， 而 且 生 成 一 张 Banner 是 没有 问题 的 。 

作者 : 2017 年 上 半年 我 当时 看 过 ARKIE 的 产品 ， 我 觉得 改 
善 空间 还 是 变 大 的 ， 你 觉得 你 在 招商 银行 做 的 自动 化 生成 设计 系 
统 比 他 们 做 得 好 吗 ? 

Shadow: 好 不 好 更 多 是 主观 意识 , 主要 看 你 用 了 哪 一 种 方法 。 
ARKIE 希望 做 到 一 句 话 生成 一 张 海 报 ， 他 们 当时 用 的 方法 需要 很 
有 经 验 的 设计 师 来 给 出 不 同 的 模板 和 规则 ， 例 如 配色 、 排 版 、 字 
体 等 。 当 时 我 把 2017 年 ARKIE 的 主要 做 法 给 研究 出 来 了 ， 详 情 
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可 以 阅读 我 公众 号 里 《DIY 一 个 AI 设计 师 _v0.0.1》 这 篇 文章 。 
我 当时 的 做 法 也 是 差不多 的 原理 ， 通 过 把 模板 动态 化 和 参数 化 ， 
就 可 以 做 到 靠 一 个 模板 生成 100 种 设计 。 只 要 提供 的 模板 质量 够 
高 ， 每 张 Banner 的 效果 都 是 能 保证 的 。 但 鹿 班 的 做 法 不 一 样 ， 
它 是 基于 阿里 所 有 的 Banner 数据 来 进行 机 器 学 习 ， 抽 象 出 相应 
的 规则 。 

作者 : 听 说 你 在 业余 时 间 独 立 开 发 了 挺 多 App， 能 大 概 分 享 
= 不 六?2 

Shadow: 没 问题 。 几 年 前 我 做 了 一 个 基于 LBS 的 明信片 应 用 ， 
名 叫 Spyfari， 这 是 我 第 一 次 用 React Native 来 开发 的 ， 整 个 开发 
花 了 大 概 三 个 月 左右 。 只 要 你 拍 了 一 张 照片 ， 它 可 以 根据 你 的 地 
理 位 置 自动 生成 一 句 话 ， 合 成 一 张 明 信 片 。 这 句 话 是 怎么 自动 生 
成 呢 ? 通过 GPS 定位 我 就 能 确定 用 户 的 地 理 位 置 在 哪 ， 然 后 将 预 
置 的 语 料 显示 出 来 ， 包 括 各 种 诗词 歌 贱 ， 它 们 都 是 通过 有 爬虫 的 方 
式 找 来 的 。 我 还 尝试 做 过 一 个 在 本 地 运行 的 抓 图 应 用 ， 把 整个 网 
站 的 图 片 都 合成 一 张 长 图 , 最 后 自动 加 些 字 成 为 一 张 海 报 。 对 了 ， 
我 还 做 过 聊天 机 器 人 ACE Land， 它 是 一 个 根据 用 户 时 间 推 荐 内 容 
的 AI 助手 App。 这 款 App 主要 调用 了 图 灵机 器 人 的 接口 ， 但 最 
后 发 现 这 不 是 我 想 做 的 主要 方向 。 在 其 他 业余 时 间 里 我 也 做 过 一 
些小 程序 的 开发 。 我 很 喜欢 做 一 些 图 文 的 结合 ， 还 有 我 比较 注重 
通过 自动 化 的 方式 减少 用 户 的 输入 ， 用 户 只 需要 输入 一 张 图 片 或 
者 打 几 个 字 就 行 了 ， 这 样 用 户 的 操作 成 本 能 降 到 最 低 。 
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《可 以 暴 烈 ， 可 以 温柔 





Spyfari 相关 截图 


作者 : 其 实 一 个 人 开发 一 个 应 用 花 了 三 个 月 不 是 很 久 ， 我 之 
前 开发 一 个 应 用 也 差不多 这 个 节奏 。 做 了 这 么 久 设 计 ， 你 觉得 设 
计 是 什么 ? 

Shadow: 先 插 个 题 外 话 ， 我 觉得 设计 有 两 种 状态 ， 一 种 状态 
的 甲 方 是 自己 ， 这 时 候 你 会 很 享受 设计 和 思考 的 过 程 ， 你 可 以 从 
不 同 的 角度 去 看 待 问题 ， 不 用 考虑 太 多 商业 化 问题 ， 这 样 的 设计 
比较 纯粹 。 另 外 一 种 状态 的 甲 方 是 其 他 人 ， 这 时 候 我 就 要 思考 甲 
方 是 怎么 想 的 ， 设 计 起 来 比较 受 限 。 回 到 正题 ， 设 计 是 什么 ? 我 
觉得 是 应 用 一 些 你 掌握 的 设计 “原材料 ”去 巧妙 地 解决 问题 。 这 
个 设计 “原材料 ”包括 你 掌握 的 技能 、 景 观 设计 采用 的 材料 、 用 
户 体验 设计 用 的 心理 学 、 交 互 的 流程 甚至 是 开发 的 代码 。 就 像 在 
菜市 场 买 不 同 的 食物 ， 通 过 各 种 亮 饪 方式 做 出 一 道道 菜 来 。 这 十 
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年 我 做 了 各 种 不 同 的 设计 ， 我 觉得 原材料 可 以 不 一 样 ， 但 方法 和 
本 质 是 一 样 的 ， 设 计 思 维 是 一 致 的 。 

作者 : 我 非常 认同 你 的 观点 ， 我 觉得 设计 师 应 该 拥有 一 技 多 
能 ,“ 一 技 ” 是 指 设计 思维 ,“ 多 能 ” 跟 你 说 的 原材料 差不多 ， 广 
泛 的 技能 和 知识 ， 这 样 你 做 设计 时 思考 才 会 更 全 面 ， 并 且 通 过 设 
计 思 维 从 不 同方 面 把 这 个 问题 解决 掉 。 下 一 个 问题 ， 你 在 AI 和 设 
计 领 域 深耕 了 这 么 久 ， 你 觉得 现在 的 AI 是 什么 ? 

Shadow: 这 个 问题 其 实 挺 宽 泛 的 。 怎 么 说 呢 ， 现 在 的 AI 要 
看 你 智能 到 哪个 程度 。 它 可 以 很 弱智 但 也 属于 AI 的 一 种 。 所 谓 的 
“很 弱智 ”是 指 通过 很 简单 的 规则 和 方式 去 解决 问题 ， 但 其 中 的 
一 些 数据 处 理 我 可 能 用 了 深度 学 习 ， 这 样 也 属于 AI， 但 听 起 来 没 
那么 高 端 。 现 在 行业 里 很 多 人 喜欢 说 自己 解决 问题 时 用 了 对 抗 生 
成 网 络 或 者 深度 学 习 ， 无 论 你 用 了 什么 方法 ， 你 解决 的 问题 都 是 
同一 个 问题 ， 只 是 最 后 评估 效果 时 看 哪个 方法 更 好 一 点 。 所 以 我 
觉得 AI 只 是 一 种 技术 手段 ， 它 跟 设 计 是 平行 的 。 

作者 : 嗯 ， 有 道理 。 我 之 前 觉得 AI 就 是 一 种 设计 方法 。 设 计 
是 用 来 解决 问题 的 ， 深 度 学 习 也 是 解决 问题 的 其 中 一 种 方法 、 一 
种 技术 。 下 一 个 话题 , 要 不 我 们 深入 聊 一 下 AI 和 设计 结合 的 案例 ? 

Shadow: 好 的 。 有 没有 听 说 过 一 个 叫 小 库 科 技 的 公司 ? 它 通 
过 AI 来 做 建筑 设计 ， 但 它 背 后 的 原理 、 实 现 的 方式 就 跟 ARKIE 
用 AI 生成 海报 的 原理 很 不 一 样 。 建 筑 方向 的 AI 更 多 是 把 精力 放 
在 知识 图 谱 的 构建 还 有 CNN 的 分 类 上 。 
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作者 : 为 什么 建筑 设计 要 做 知识 图 谱 ? 

Shadow: 因为 建筑 里 有 很 多 规范 。 例 如 一 个 小 区 ， 它 的 层 高 
应 该 是 多 少 ， 容 积 率 是 多 少 ， 每 一 个 套房 的 户型 和 面积 是 多 少 ， 
每 一 户 拥有 几 个 房间 ， 每 一 个 房间 的 面积 是 多 少 ， 这 些 数据 背后 
都 有 很 强 的 规范 和 要 求 。 

作者 : 所 以 ARKIE 是 没有 做 这 些 规范 和 知识 图 谱 的 ， 因 为 设 
计 涵 括 了 主观 因素 ， 比 较 抽 象 ， 很 难 用 规范 来 构建 美学 的 知识 图 谱 。 

Shadow: 对 ， 我 之 前 在 招商 银行 的 时 候 就 想 过 做 一 个 美学 的 
知识 图 谱 出 来 ， 但 很 难 做 知识 的 分 类 。 例 如 “对 称 ” 这 个 词 ， 它 
到 底 是 算 在 布局 还 是 视觉 的 平衡 里 ? 我 很 难 定义 每 个 知识 的 节点 
和 它们 的 关系 。 但 建筑 领域 不 是 纯 设 计 方 向 的 ， 它 在 很 多 方面 都 
有 自己 的 规范 和 要 求 ， 它 们 都 是 强制 性 的 ， 所 以 是 有 可 能 做 成 知 
识 图 谱 的 。 

作者 : 之 前 看 过 一 篇 关于 通过 机 器 学 习 改 造 汽车 底盘 的 案 
例 ， 这 家 名 叫 Hack rod 先 用 3D 技术 打印 了 一 个 汽车 底盘 ， 然 后 
在 赛车 时 通过 各 种 传感器 获取 不 同 的 真实 数据 ， 让 机 器 在 虚拟 环 
境 中 不 断 学 习 、 不 断 自动 地 改变 底盘 的 结构 。 我 想 了 解 一 下 ， 建 
筑 设 计 能 用 类 似 的 方法 以 及 结合 知识 图 谱 来 实现 设计 么 ? 

Shadow: 建筑 设计 用 这 种 方法 不 太 现实 ， 因 为 这 么 做 必须 要 
先 把 建筑 建 起 来 ， 成 本 非常 高 。 你 说 的 方法 更 多 是 数据 驱动 的 形 
式 ， 现 在 景观 设计 和 建筑 设计 有 类 似 的 思维 ， 例 如 人 参数 化 设计 。 
但 这 时 候 已 经 设计 好 模型 ， 并 不 会 去 改进 。 如 果 要 实现 改进 ， 就 
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需要 一 个 仿真 器 来 实现 ， 这 是 难点 之 一 。 按 我 的 认 知 ， 结 构 设 计 
是 有 仿真 嚣 的， 因为 力学 的 仿真 系统 已 经 非常 成 熟 ， 例 如 桥梁 的 
设计 ， 可 以 通过 不 断 地 仿真 、 不 断 地 调节 参数 使 桥梁 设计 达到 最 
好 的 状态 。 但 是 建筑 设计 考虑 的 因素 很 多 ,例如 它 能 容纳 多 少 人 ， 
每 个 时 间 段 的 人 流 分 布 是 怎样 的 , 还 有 各 种 主观 因素 , 包括 设计 感 、 
商业 化 、 甲 方 的 个 人 喜好 等 ， 建 筑 设 计 不 是 一 个 纯 理 性 的 设计 ， 
所 以 很 难 把 这 些 因素 结合 在 一 起 进行 模拟 。 

我 再 举 一 个 关于 珠宝 设计 的 例子 。 现 在 用 户 数据 的 获取 越 来 
越 简单 ， 加 上 3D 打印 、 纳 米 微雕 等 技术 的 成 熟 ， 结 合 AI 的 个 性 
化 定制 珠宝 有 了 更 多 的 可 能 性 。 传 统 的 珠宝 设计 流程 比较 长 ， 设 
计 师 需要 让 客户 或 亲自 根据 创意 灵感 手绘 出 设计 草图 ， 并 以 这 个 
为 蓝本 不 断 修 改 ， 然 后 根据 珠宝 设计 图 制作 珠宝 模板 ， 再 用 手工 
雕 蜡 起 版 或 者 用 计算 机 CAD 起 版 ， 再 经 过 倒 模 、 执 模 、 镶 嵌 、 抛 
光 和 表面 处 理 ， 最 后 进行 品质 检验 和 出 具 证书 。AI 珠宝 设计 师 在 
给 出 最 终 的 珠宝 设计 图 前 可 以 做 很 多 事情 ， 例 如 让 机 器 获取 用 户 
的 个 人 数据 ， 包 括 声 音 、 身 高 、 体 重 、 心 率 还 有 个 人 喜好 ， 以 及 
用 户 选择 的 材质 、 符 号 、 重 量 等 珠宝 参数 , 然后 将 这 些 数据 可 视 化 ， 
结合 相关 的 算法 生成 不 一 样 的 设计 ， 最 后 让 用 户 寻 找 最 喜欢 的 3D 
珠宝 模型 。AI 珠宝 设计 师 甚 至 能 让 用 户 自行 对 珠宝 进行 造型 ， 用 
户 只 需要 画 出 大 概 的 形状 ， 就 能 利用 RNN 把 最 匹配 用 户 的 3D 珠 
宝 模型 显示 出 来 。 如 果 对 AI 珠宝 设计 感 兴趣 ， 可 以 阅读 我 公众 号 
里 的 《DIY 一 个 人 工 智能 珠宝 设计 师 v1.0》。 
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作者 : 明白 了 。 要 不 我 们 换 一 个 话题 吧 。 有 些 时 候 我 真心 觉 
得 不 懂 技 术 做 起 设计 会 很 局 限 ， 就 跟 言 人 摸 象 差不多 。 你 很 难看 
清楚 你 的 产品 本 质 是 什么 ， 框 架 是 什么 。 你 觉得 编程 开发 能 力 对 
你 的 设计 来 说 有 什么 帮助 ? 

Shadow: 简单 点 就 是 懂 开 发 能 让 你 的 设计 更 有 技术 含量 。 我 
举 一 个 聊天 机 器 人 的 例子 ， 如 果 你 不 懂得 开发 ， 你 是 不 会 知道 聊 
天 机 器 人 的 效果 如 何 评估 ， 你 也 不 知道 用 什么 手段 来 提高 这 个 效 
果 。 如 果 你 是 一 名 普通 的 设计 师 ， 你 可 能 会 认为 全 部 的 聊天 机 器 
人 都 可 以 像 网 上 宣传 的 那么 高 端 、 那 么 好 用 ， 然 后 你 也 可 以 把 你 
家 的 产品 设计 得 一 样 智能 , 但 其 实 一 点 意义 都 没有 ， 因 为 做 不 到 。 
但 普通 的 设计 师 会 觉得 ， 这 肯定 能 做 到 ， 因 为 这 样 的 闲聊 人 类 是 
能 理解 的 ， 而 且 别 人 家 竞 品 也 是 这 样 做 的 。 当 你 的 产品 理念 脱离 
了 实际 可 实现 的 方案 ， 那 么 会 永远 达 不 到 你 的 产品 目的 。 再 举 一 
个 滤 镜 的 例子 。 如 果 是 设计 师 的 话 ， 他 可 能 觉得 用 Photoshop 对 
一 张 图 片 加 个 很 酷 炫 的 滤 镜 很 简单 ， 然 后 交 给 程序 员 让 他 们 实现 
出 来 。 

作者 : 滤 镜 这 个 案例 讲 得 太 对 了 。 我 之 前 在 公司 做 过 相机 相 
关 的 产品 ， 基 本 上 大 家 的 滤 镜 都 是 用 开源 代码 实现 的 ， 自 己 重新 
写 一 个 不 太 现实 ， 因 为 很 少 工程 师 懂 得 图 像 处 理 技术 。 虽 然 说 滤 
镜 的 表现 跟 设 计 师 非常 相关 ， 但 其 实 跟 设计 师 也 没有 太 多 关系 ， 
因为 你 考虑 的 东西 工程 师 很 可 能 做 不 出 来 。 

Shadow: 我 们 沿 着 滤 镜 这 个 话题 继续 往 下 聊 ， 我 最 近 在 看 滤 
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镜 的 实现 ， 比 较 好 的 滤 镜 效果 都 是 通过 GPU 着 色 器 去 写 的 。 如 果 
是 常规 的 图 片 处 理 ， 用 像素 的 处 理 方式 来 做 滤 镜 效率 会 太 低 ， 而 
且 款 式 少 。 但 是 用 GPU 着 色 器 去 写 滤 镜 的 话 ， 这 对 很 多 工程 师 来 
说 真 的 很 难 ， 并 不 是 所 有 的 工程 师 都 懂得 着 色 器 开发 。 而 且 着 色 
器 功能 很 强大 ， 它 能 做 到 怎样 的 酷 炫 程度 连 设计 师 都 不 知道 。 

作者 : 是 的 。 我 之 前 写 过 前 端 相关 的 代码 ， 我 相信 很 多 工程 
师 能 写 页 面 的 代码 ， 但 很 棒 的 动 效 代码 并 不 是 所 有 前 端 工程 师 都 
能 写 得 出 来 ， 因 为 他 们 没有 去 学 这 种 知识 。 而 且 一 个 特别 棒 的 动 
效 更 多 是 设计 和 开发 的 结合 ， 这 是 跨 领域 的 。 还 有 很 多 工程 师 是 
没有 学 过 SVG 的 ，SVG 我 也 只 是 看 过 一 些 ， 它 虽然 只 是 一 个 文 
件 格式 ， 其 实 能 做 到 很 多 东西 ， 包 括 各 种 复杂 的 动画 。 我 两 年 前 
写 自己 官网 的 时 候 也 用 了 SVG 动画 来 做 ， 真 的 很 复杂 ， 我 只 能 看 
着 别人 的 源 代 码 慢 慢 去 改 成 我 想 要 的 效果 ， 但 要 让 我 自己 从 0 到 1 
开始 学 习 和 开发 SVG， 就 很 不 现实 ， 因 为 真 的 没 时 间 。 

Shadow: 对 的 ， 这 个 涉及 你 要 专注 某 个 领域 还 是 所 有 领域 都 
要 去 了 解 。 

作者 : 2017 年 鹿 班 的 出 现 导 致 网 上 很 多 设计 师 都 在 担心 自己 
会 被 淘汰 ， 你 怎么 看 待 AI 和 设计 师 的 关系 ? 

Shadow: 我 觉得 AI 和 设计 师 的 关系 主要 有 几 种 。 一 种 是 纯 
劳动 力 的 设计 师 ， 他 们 就 只 懂得 复制 、 粘 贴 和 改 图 ， 这 种 设计 师 
是 很 有 可 能 被 取代 掉 的 。 还 有 一 种 是 深耕 自己 专业 领域 的 设计 师 ， 
这 样 的 设计 师 AI 可 能 跟 他 关系 不 是 很 大 。 
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作者 : 这 个 我 不 太 同意 你 的 看 法 。 就 好 像 临 莫 一 幅 画 ， 有 些 
人 花 了 很 长 时 间 来 临摹 , 我 觉得 这 个 更 多 像 深 耕 而 不 是 纯 劳 动力 ， 
但 AI 可 能 用 风格 迁移 的 手段 一 下 子 就 能 把 临摹 处 理 得 很 好 。 

Shadow: 咽 ， 但 这 个 更 多 是 艺术 ， 艺 术 不 是 一 件 工业 品 ， 工 
业 品 才 会 讲求 效率 ， 你 要 的 艺术 是 想 让 机 器 生产 还 是 人 去 创作 ， 
这 是 值得 深思 的 。 我 最 近 还 有 其 他 的 想法 ， 例 如 在 某 个 领域 深耕 
的 设计 师 如 果 能 很 快 地 在 这 个 领域 树立 自己 的 品牌 ， 他 就 占据 了 
先天 优势 ， 就 算 AI 再 强 ， 都 很 难 跟 他 竞争 。 

作者 : 说 得 对 。 我 觉得 对 设计 师 来 说 ， 技 法 可 能 到 达 了 天 花 
板 ， 但 你 的 想法 和 影响 力 才 是 最 重要 的 。 这 里 我 是 挺 有 感触 的 ， 
我 2012 年 开始 自学 交互 设计 的 时 候 ， 把 2014 年 前 市 面 上 的 交互 
书籍 都 看 完了 ， 但 2015 年 后 我 发 现 很 难 再 找到 新 的 交互 书籍 ， 因 
为 当时 对 于 交互 设计 大 家 都 探索 得 差不多 了 ， 所 以 写 书 的 都 变 少 
了 。 当 每 个 人 的 交互 设计 技法 水 平 都 差不多 的 时 候 ， 更 重要 的 是 
思考 如 何 提高 自己 的 其 他 能 力 ， 例 如 对 业务 的 理解 、 如 何 扩充 自 
己 其 他 领域 的 想法 和 技法 。 

Shadow: 是 的 ， 所 以 说 AI 跟 设计 师 的 关系 蛮 难 定义 的 ， 最 
终 要 看 这 个 设计 师 是 怎么 定位 的 ， 他 是 跨 界 的 还 是 只 懂 一 点 点 。 
AI 对 跨 界 设计 师 来 说 只 是 一 个 工具 。 但 这 种 跨 界 人 才 已 经 很 难 用 
设计 师 这 个 职业 来 定义 了 ， 我 觉得 他 比 设计 师 要 更 高 一 个 层面 。 

作者 : 是 的 ， 我 们 聊 一 聊 最 后 一 个 问题 吧 。 你 觉得 设计 师 要 
怎么 拓宽 自己 的 视野 ? 
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Shadow: 最 重要 的 是 心态 ， 心 态 一 定 要 开放 。 不 管 是 哪个 领 
域 或 者 内 容 , 你 都 要 以 开放 的 心态 接触 它们 ,接触 完 你 再 给 反馈 。 
你 不 能 一 上 来 就 特别 反感 别人 提出 的 观点 或 者 其 他 领域 积累 的 经 
验 。 你 不 要 觉得 自己 的 就 是 一 定 对 的 。 你 要 这 么 想 ， 对 方 讲 的 可 
能 是 对 的 ， 我 要 先 听 进去 ， 然 后 再 综合 考虑 。 平 等 地 考虑 每 一 个 
观点 ， 我 觉得 这 样 就 能 很 容易 拓展 自己 的 视野 和 能 力 ， 但 其 实 很 
难 做 到 。 还 有 就 是 多 跟 其 他 行业 的 人 一 起 交流 ， 并 且 跟 有 不 同 经 
验 的 人 群 交流 ， 例 如 很 年 轻 的 大 学 生 或 者 五 六 十 岁 的 长 辈 ， 聊 天 
的 时 候 就 是 在 拓展 自己 的 视野 。 我 创建 的 Mixlab 社区 也 是 为 了 这 
个 目的 ， 让 不 同行 业 的 人 相互 学 习 ， 共 同 进步 。 





7.2 ”如何 设 计 AI 音箱 和 VR 产品 


南 迪 尔 : 我 叫 南 迪 尔 ， 大 学 毕业 后 在 工业 设计 领域 比较 出 名 
的 设计 公司 LKK 工作 ， 然 后 2012 年 加 入 百度 ， 主 要 负责 百度 云 
的 交互 设计 ， 之 后 成 为 智能 硬件 团队 的 设计 经 理 ， 负 责 的 项 目 包 
括 小 度 Wi-Fi、 百 度 路 由 器 、 智 能 手表 Rom 等 一 系列 智能 硬件 。 
2016 年 6 月 我 加 入 小 米 探索 实验 室 担 任 设计 总 监 ， 负 责 小 米 路 由 
器 、 小 米 VR 还 有 最 近 比 较 火 的 小 米 AI 音箱 “小 爱 同学 ” 

作者 : 你 觉得 2014 年 做 的 百度 路 由 器 和 现在 做 的 小 米 路 由 器 
有 什么 不 同 吗 ? 
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南 迪 尔 : 其 实 很 多 地 方 还 是 比较 相似 的 ， 例 如 大 家 都 在 追求 
更 简单 的 用 户 配置 流程 ， 用 户 对 于 互联 网 的 主要 需求 依然 是 一 个 
稳定 的 网 络 ， 这 个 需求 没有 发 生变 化 。 

作者 : 在 我 的 理解 里 ， 用 户 的 全 部 网 络 流量 都 要 通过 路 由 器 ， 
而 且 它 是 24 小 时 开机 的 ， 我 觉得 是 不 是 只 要 加 个 语音 功能 它 就 能 
成 为 中 控 系统 ， 后 面 就 没有 智能 音箱 的 事 了 ? 

南 迪 尔 : 路 由 器 和 智能 音箱 都 是 中 枢 系 统 。 两 者 的 区 别 在 于 
路 由 器 是 一 个 网 络 中 枢 ， 所 有 的 东西 都 要 通过 路 由 器 来 连接 到 互 
联网 。 智 能 音箱 是 一 个 控制 中 枢 ， 用 户 通 过 它 来 控制 其 他 设备 。 
你 刚刚 说 的 可 以 认为 是 理想 状态 或 者 实验 室 状态 。 但 实际 情况 是 ， 
如 果 增 加 了 语音 功能 , 那么 会 有 多 少 用 户 愿 意 花 钱 买 这 个 路 由 器 ? 
现在 一 个 路 由 器 的 价格 大 概 是 100 元 ， 如 果 增 加 一 个 语音 功能 ， 
整个 产品 的 价格 要 接近 200 元 。 如 果 这 个 路 由 器 可 以 通过 语音 控 
制 家 庭 里 的 IoT (Internet of Things， 物 联网 ) 产品 ， 问 题 来 了 ， 
有 多 少 家 庭 家 里 是 有 IoT 设备 的 ? 如 果 增 加 了 这 个 语音 功能 ， 这 
多 加 的 100 元 已 经 把 没有 IoT 产品 的 所 有 用 户 排除 在 外 ， 而 且 购 
买 这 款 产 品 的 人 群 IoT 需求 到 底 有 多 少 ? 用 户 有 可 能 前 两 天 用 起 
来 很 爽 ， 但 是 到 后 面 就 只 是 用 语音 来 开 个 灯 。 这 些小 需求 能 不 能 
对 得 起 用 户 多 花 的 100 元? 

作者 : 有 道理 。 我 想 了 解 一 下 ， 这 几 年 你 都 在 做 智能 硬件 的 
项 目 ， 你 觉得 在 2014 年 和 2018 年 做 智能 硬件 设计 时 有 什么 变 
化 吗 ? 
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南 迪 尔 : 我 在 百度 的 时 候 ， 严 格 来 说 ， 当 时 的 百度 硬件 积累 
相对 较 少 ， 基 本 将 硬件 外 包 给 其 他 厂商 ， 所 以 当时 我 对 硬件 的 把 
控 力 度 相对 较 弱 ， 而 且 了 解 得 比较 少 ， 所 以 基本 都 是 在 做 软件 层 
面 的 设计 。 但 到 了 小 米 之 后 ， 我 发 现 小 米 的 硬件 和 软件 是 属于 同 
一 个 部 门 ， 而 且 小 米 在 硬件 上 的 积累 很 深 。 在 小 米 的 几 年 里 ， 我 
对 智能 硬件 有 更 深入 的 理解 , 包括 硬件 的 组 成 部 分 、 硬件 的 定义 、 
软件 和 硬件 的 连接 、 它 们 之 间 是 怎样 交互 的 ， 同 时 我 能 对 整个 用 
户 体验 流程 看 得 更 加 完整 。 我 们 做 设计 的 时 候 甚至 可 以 影响 硬件 
的 设计 。 以 智能 音箱 的 配置 过 程 为 例 ， 当 智能 音箱 的 软件 和 硬件 
都 摆 在 你 面前 的 时 候 ， 你 用 手机 配置 音箱 的 过 程 中 ， 音 箱 会 不 断 
给 予 你 反馈 ， 这 会 导致 你 的 注意 力 在 手机 和 音箱 之 间 来 回 切 换 ， 
我 们 觉得 这 不 是 一 个 好 的 设计 。 所 以 我 们 有 意 地 把 用 户 注意 力 先 
集中 在 手机 上 ， 音 箱 作 为 辅助 ， 它 只 要 发 出 确认 的 声音 就 行 了 。 
当 用 户 用 手机 配置 成 功 后 ， 再 把 用 户 的 注意 力 转 移 到 音箱 上 进行 
互动 和 操作 。 如 果 不 这 么 做 的 话 ， 用 户 注意 力 的 来 回 切换 会 导致 
整个 配置 流程 很 长 ， 也 会 分 散 用 户 的 精力 。 

作者 : 那 你 们 当时 是 怎样 考虑 智能 音箱 上 的 反馈 设计 的 ? 

南 迪 尔 : 设计 “小 爱 同学 ”的 时 候 , 灯光 反馈 更 多 是 辅助 功能 。 
灯光 亮 的 时 候 其 实 是 在 给 你 一 个 信号 ， 意 思 是 “你 可 以 说 话 了 ”。 
灯光 是 特定 的 语言 ， 它 模拟 了 两 个 人 对 话 过 程 中 对 方 的 眼神 :对 
方 的 注意 力 是 不 是 在 你 身上 ， 是 的 话 你 就 可 以 说 话 了 。 当 然 这 时 
候 的 反馈 不 只 是 灯光 ， 还 有 声音 。 声 音 反 馈 是 非常 必要 的 ， 原 因 
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是 当 你 背 对 着 它 的 时 候 或 者 不 看 它 的 时 候 ， 通 过 声音 反馈 就 知道 
可 以 操作 了 。 我们 第 一 版 的 声音 反馈 设计 用 的 是 “ 嘟 ”， 就 像 “ 小 
爱 同学 ” 冲 到 你 的 身边 ， 第 二 版 我 们 将 “ 嘟 ” 改 成 “在 ,我 在 ”， 
这 能 让 人 感觉 到 更 温暖 。 还 有 我 们 的 灯光 定义 了 好 几 种 模式 。 例 
如 说 “小 爱 同 学 ”， 这 时 候 发 出 的 是 灯光 表示 它 在 响应 你 以 及 在 
聆听 ; 当 你 说 完 指 令 ， 灯 光 发 生 的 变化 代表 它 在 思考 ; 而 当 它 给 
予 反馈 时 灯光 会 有 另外 一 个 变化 。 这 套 灯 光 设计 其 实 仿照 了 一 个 
人 的 “我 在 听 你 说 ”“ 我 在 思考 ”“ 我 在 说 ”这 三 种 状态 。 

作者 : 你 怎么 看 待 最 近 Echo show 增加 了 屏幕 ? 语音 交互 是 
否 需要 屏幕 ? 

南 迪 尔 : 这 是 肯定 的 ， 语 音 交 互 和 屏幕 结合 是 一 件 好 事 。 我 
之 前 在 知 乎 回答 过 一 个 问题 了 , 说 明了 语音 只 适合 有 明确 意图 的 输 
入 ， 也 就 是 说 可 以 方便 地 问 问题 ， 但 语音 不 适合 输出 ， 语 音 输出 
的 内 容 太 有 限 了 ， 因 为 它 是 一 维 的 ， 用 户 根本 记 不 住 。 我 当时 举 
过 一 个 很 让 人 崩溃 的 例子 : “中 文 请 按 1，English press 2， 金 葵 
花 客户 请 按 3”， 当 听 过 一 遍 后 ， 我 可 能 会 忘 了 要 按 哪个 ， 还 得 
重 听 一 遍 。 音 频 选 项 你 是 记 不 住 太 多 的 ， 项 多 就 能 记 住 4 个 ; 但 
是 视觉 界面 不 一 样 ，12 个 选项 都 没有 问题 。 

作者 : 的 确 ， 我 当时 买 了 “小 度 在 家 ”和 “小 爱 同 学 ”， 但 
我 发 现 有 屏幕 的 “小 度 在 家 ”能 做 的 事情 更 多 。 

南 迪 尔 : 现在 “小 爱 同学 ”更 多 是 用 来 放歌 、 问 天 气 、 问 生 














人 ”请 在 知 平 上 搜索 问题 “语音 交互 会 变 成 未 来 的 主流 交互 方式 吗 ? ” 


=— 233 


| Al 改变 设计 | 人 工 智能 时 代 的 设计 师 生存 手册 


活 中 的 一 些 百 科 知 识 ， 还 有 对 IoT 设备 的 控制 ， 我 觉得 这 是 大 部 
分 人 的 场景 和 需求 。 

作者 : 如 果 智能 音箱 解决 的 主要 需求 是 播放 音乐 ， 没 有 其 他 
需求 会 不 会 导致 没有 人 去 研发 其 他 功能 ， 那 语音 交互 怎么 发 展 ? 
我 觉得 语音 交互 的 发 展会 受到 很 大 的 局 限 。 

南 迪 尔 : 语音 交互 很 早 就 在 手机 上 有 了， 没有 发 展 起 来 是 因 
为 在 公共 场合 的 噪音 比较 大 ， 人 们 在 公众 场合 使 用 语音 交互 效率 
不 一 定 高 ， 还 有 一 些 人 觉得 对 着 一 个 手机 说 话 会 有 点 傻 ， 还 有 就 
是 隐私 的 问题 ， 所 以 语音 交互 的 场景 是 有 限 的 。 之 所 以 智能 音箱 
能 发 展 起 来 ,是 因为 它 在 家 里 ,家 里 比较 安静 ， 它 是 私密 的 空间 。 
如 果 “ 隐 私 ” 和 “不 适 感 ” 这 两 件 事情 是 人 们 心理 接受 程度 问题 的 话 ， 
随 着 时 间 发 展 ， 人 们 会 慢 慢 接受 。 因为 语音 和 搜索 相关 性 比较 高 ， 
输入 效率 非常 高 。 当 一 个 高 效 的 事情 能 克服 不 舒适 感 或 者 隐私 问 
题 ， 它 会 有 市 场 的 。 

作者 : 那 你 觉得 移动 互联 网 的 设计 和 语音 交互 设计 有 什么 区 
别 ? 

南 迪 尔 : 移动 互联 网 设计 和 语音 交互 在 一 些 基 本 的 、 隐 性 的 
设计 上 是 没有 区 别 的 ， 例 如 说 你 都 要 考虑 场景 和 用 户 的 情绪 。 但 
语音 交互 的 设计 有 点 不 一 样 ， 就 是 它 没有 视觉 部 分 ， 这 会 导致 它 
是 一 个 开放 性 的 提问 。 视 觉 界面 的 好 处 是 你 能 看 到 边界 ， 你 能 进 
行 引 导 ; 但 语音 是 没有 边界 和 引导 的 ， 所 以 你 要 学 会 创造 引导 。 
以 设置 一 个 闹钟 为 例 ， 视 觉 界面 很 简单 ， 几 个 时 间 控 件 就 能 把 你 
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完全 限制 在 这 个 功能 里 。 但 用 语音 设置 闹钟 ， 我 可 能 需要 说 “小 
爱 同 学 我 要 设置 一 个 闹钟 ”， 然 后 它 会 问 你 “ 那 你 要 设置 几 点 
呢 ? ”“ 八 点 ”“ 请 问 是 早上 八 点 还 是 晚上 八 点 ”“ 晚 上 八 点 ”“ 好 
的 ， 设 置 完毕 ”， 语 音 交 互 会 通过 多 轮 对 话 把 你 的 发 散 范围 逐步 
缩小 到 这 个 任务 上 。 

作者 : 的 确 ， 我 之 前 也 想 过 这 个 问题 ， 视 觉 界 面 能 限制 用 户 
的 想法 ， 语 音 交 互 就 不 能 ， 我 们 只 能 在 语音 上 创造 限制 。 我 们 再 
聊 一 下 VR 吧 。2016 年 被 称 为 VR 的 元 年 ， 突 然 间 2017 年 又 变 成 
人 工 智能 的 元 年 ， 你 怎么 看 待 2018 年 VR 的 发 展 ， 它 是 不 是 不 温 
不 火 ? 

南 迪 尔 : 我 觉得 VR 的 发 展 是 正常 的 。 新 起 的 行业 第 一 波 总 
会 吹 成 泡沫 ， 因 为 投资 市 场 不 是 冷静 的 。 第 一 波 泡沫 过 去 后 留 下 
的 人 会 继续 推动 这 个 行业 的 发 展 。 目 前 行业 的 发 展 还 是 在 硬件 的 
成 熟 和 积累 阶段 ， 包 括 现在 的 Oculus Go、Vive， 虽 然 它 们 已 经 很 
不 错 了 ， 但 还 不 是 最 终 形态 。 当 它们 逐渐 接近 最 终 形态 的 时 候 ， 
会 有 越 来 越 多 的 软件 加 入 ， 会 有 越 来 越 多 的 人 认识 到 它们 的 价值 
然后 依赖 于 它们 ， 最 后 它们 才能 形成 最 终 的 形态 。 

作者 : 那 你 觉得 VR 跟 移 动 互 联网 的 产品 有 什么 本 质 的 区 别 





吗 ? 

南 迪 尔 : 移动 互联 网 的 产品 可 以 分 为 两 类 , 一 类 是 节省 时 间 的 ， 
例如 外 卖 、 百 度 ; 另外 一 类 是 “浪费 ”时 间 的 , 例如 拌 音 、 爱 奇 艺 、 
今日 头条 。VR 目前 来 看 更 多 是 应 用 在 “浪费 ”时 间 的 ， 基 本 不 包 
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括 节省 时 间 这 个 类 别 。VR 本 身 的 硬件 形态 就 决定 了 它 没有 手机 更 
省 时 间 ， 因 为 你 要 戴 上 笨重 的 头盔 ， 在 里 面 看 不 到 你 的 手指 ， 也 
没有 合适 的 键盘 ， 你 的 输入 效率 并 不 高 。 而 且 现 在 的 头盔 携带 性 
不 好 ， 不 能 随身 到 处 带 着 。 如 果 VR 想像 移动 互联 网 这 样 爆 发 的 话 ， 
它 的 硬件 形态 一 定 要 比 掏 手机 更 省 事 ， 而 且 价格 也 要 很 低 。 

作者 : 我 在 2015 年 写 过 一 篇 文章 来 分 析 VR 和 AR 哪 一 个 会 
先 火 起 来 并 进入 大 众 的 视野 ， 最 后 我 选择 了 AR。 我 觉得 VR 体验 
不 只 是 依赖 视觉 和 听觉 ， 你 的 触觉 、 嗅 觉 都 是 息息相关 的 。 但 是 
AR 不 会 有 这 么 多 的 限制 ， 它 不 会 有 这 么 多 的 技术 瓶颈 在 这 里 ， 只 
要 你 搞定 了 图 像 识别 基本 就 够 了 ， 你 觉得 呢 ? 

南 迪 尔 : 我 觉得 手机 普及 速度 很 快 的 原因 是 它 节省 时 间 的 功 
能 很 多 ， 它 能 帮 你 联系 到 人 、 订 外 卖 、 查 资料 、 买 东西 。 同 理 ， 
AR 能 做 很 多 节省 时 间 的 事情 ， 所 以 我 相信 它 的 普及 速度 会 比较 快 。 
VR 更 多 走 的 是 PlayStation 和 Xbox 的 道路 ， 就 是 娱乐 和 消费 。 如 
果 VR 想 要 走 进 大 众 的 视野 ， 在 效率 层面 一 定 要 超过 手机 ， 现 在 
某 些 领域 VR 的 效率 优势 非常 明显 ， 例 如 看 房 ， 有 了 VR 你 就 不 
用 到 现场 看 房 了 ， 还 有 像 室 内 设计 这 些 ToB 的 领域 VR 都 有 可 能 
超越 手机 或 PC 的 体验 和 效率 。 

作者 : 那 你 觉得 做 VR 设计 和 做 移动 互联 网 设计 有 什么 不 一 
样 的 地 方 吗 ? 

南 迪 尔 : 设计 的 对 象 变 了 、 设 计 的 场景 变 了 、 设 计 的 工具 变 
了 、 设 计 的 平台 变 了 ,但 设计 本 质 没什么 变化 。 在 形式 设计 上 ， 
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要 考虑 更 多 的 是 VR 中 平面 和 空间 变 得 无 限 大 ， 有 前 后 和 层次 
关系 。 

作者 : 我 觉得 还 有 一 个 因素 : 时 间 的 变化 。 空 间 和 时 间 是 结 
合 在 一 起 的 ， 平 面 就 不 一 样 ， 你 可 以 上 果 着 它 去 看 很 入， 但 你 看 VR 
电影 的 时 候 , 你 看 左 侧 时 右 侧 就 看 不 到 了 , 信息 不 能 被 用 户 接 收 ， 
我 觉得 这 个 也 是 VR 和 平面 设计 的 很 大 区 别 。 

南 迪 尔 : 对 ， 你 说 的 有 道理 。 还 有 就 是 ， 有 些 信息 有 自己 的 
展现 形态 ， 它 们 的 传递 是 不 需要 三 维 空间 的 ， 例 如 图 片 、 文 字 ， 
它们 不 一 定 要 转换 成 3D。 当 你 要 看 一 本 小 说 ， 你 把 文字 加 厚 变 成 
立体 的 文字 ， 其 实 没有 任何 意义 ， 因 为 文字 的 二 维 形态 就 是 最 优 
解 了 。VR 增强 的 是 你 的 体验 ， 在 信息 传递 的 角度 来 看 它 没有 太 
大 的 变化 。 但 是 有 些 东 西 本 来 就 是 三 维 产品 ， 它 们 是 带 有 三 维 信 
息 的 ， 例 如 你 从 一 张 照片 里 看 到 的 房间 和 走 进 这 个 空间 里 看 到 的 
房间 ， 感 受 是 完全 不 一 样 的 ， 三 维 信息 在 VR 里 展现 才能 突出 VR 
的 优势 。 如 果 你 用 一 个 高 维度 的 工具 来 看 低 维度 的 内 容 ， 低 维度 
的 内 容 还 是 低 维度 的 内 容 。 所 以 你 问 VR 的 界面 设计 有 什么 不 同 ， 
当 你 的 二 维 内 容 从 平面 移植 到 三 维 空间 时 ， 其 实 没有 什么 不 同 ， 
只 是 展示 面积 变 得 更 大 了 ， 设 计时 我 虽然 能 用 更 多 的 层次 关系 ， 
但 本 质 上 文字 还 是 文字 ， 光 标 还 是 光标 。 

作者 : 最 后 一 个 问题 ， 你 认为 年 轻 的 设计 师 怎么 拓展 自己 的 
视野 ? 还 有 怎么 提高 自己 的 思考 深度 ? 

南 迪 尔 : 我 觉得 拓展 视野 分 两 个 维度 。 第 一 个 维度 是 知识 的 
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积累 ， 你 可 以 上 知 乎 或 者 国内 外 的 网 站 学 习 相关 的 知识 以 及 阅读 
相关 的 报道 ， 但 我 觉得 更 重要 的 另 一 个 维度 是 你 要 亲眼 看 到 一 些 
人 做 过 的 事情 , 才 会 有 感觉 。 例如 你 可 以 多 参加 一 些 展 会 和 演讲 ， 
亲眼 学 习 这 些 设 计 师 是 用 了 什么 思路 ， 最 后 做 出 什么 样 的 产品 。 
对 于 思考 深度 , 要 多 问 自己 几 个 为 什么 , 时 间 长 了 就 会 形成 习惯 ， 
你 就 会 往 最 本 质 的 原因 去 想 。 如 果 你 想 形成 这 样 的 思维 习惯 ， 一 
开始 需要 一 定 的 刻意 练习 。 刻 意 练习 就 是 遇 到 一 个 问题 ， 思 考 它 
背后 的 原因 ， 然 后 把 原因 记 下 来 ， 再 去 想 这 个 原因 背后 的 原因 ， 
如 此 重复 下 去 ， 想 到 不 能 再 想 了 。 通 过 刻意 练习 的 训练 ， 你 的 思 
考 方式 会 逐渐 变化 并 形成 惯性 。 还 有 就 是 别 光 想 ， 一 定 要 用 文字 
写 下 来 ， 大 脑 是 一 个 很 强 的 CPU， 但 是 它 的 内 存 不 足 ， 所 以 你 要 
把 文字 和 思考 写 到 纸 上 ， 然 后 只 让 大 脑 去 做 思考 的 事情 。 








7.3 设计 师 如 何在 智能 化 时 代 持 续 学 习 和 
成 长 ? 


00: 我 叫 00， 算 是 一 名 互联 网 老兵 了 。 跟 其 他 设计 师 不 太一 
样 的 是 ， 我 一 开始 在 网 易 邮箱 担任 产品 经 理 。 在 用 户 体验 发 展 的 
初期 我 发 现 这 是 一 个 插 有 价值 的 领域 ， 然 后 转向 了 用 户 体验 设计 ， 
从 产品 经 理 变 成 了 用 户 研究 员 ， 再 往 后 一 直 在 做 产品 和 交互 设计 
相关 的 工作 。 前 几 年 在 微 信 支 付 团队 工作 ,移动 支付 正在 开始 普及 ， 
我 们 为 服务 行业 做 了 很 多 打通 线 上 和 线 下 全 流程 的 通用 解决 方案 
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设计 ， 例 如 给 餐饮 行业 设计 相关 的 服务 流程 ， 帮 助 他 们 在 支付 环 
节 提 升 运营 的 效率 和 服务 的 质量 。 在 2016 年 由 于 我 对 心理 学 比较 
感 兴 趣 ， 所 以 加 入 了 一 个 心理 学 相关 的 创业 项 目 ， 那 时 还 参加 了 
一 门 叫 Fab Academy 的 课程 , 最 近 刚 学 完 Udacity 的 深度 学 习 课 程 。 

作者 : 能 不 能 简单 介绍 一 下 Fab Academy ? 当时 为 什么 想 学 
Fab Academy 这 门 课程 ? 

00: Fab Academy 是 MIT 里 的 原子 与 比特 中 心 开设 的 一 门 课 
程 ， 它 的 目的 是 让 全 球 范围 内 对 制造 和 创 客 感 兴趣 的 人 学 会 数字 
化 制造 的 流程 ， 让 每 个 人 都 有 能 力 亲 手 制作 复杂 的 东西 ， 并 学 
用 各 种 工具 升级 传统 的 生产 流程 。 由 于 我 一 直 在 做 交互 设计 ， 所 
以 我 希望 能 够 实现 一 些 自己 的 想法 ， 而 不 只 是 把 它 的 流程 给 想象 
出 来 。 在 好 几 年 前 关注 智能 硬件 领域 时 ， 留 意 到 MIT 有 一 门 课 程 
叫 How to make almost anything, 但 可 惜 在 网 上 找 不 到 相关 的 课程 。 
2016 年 我 发 现 深圳 SZoil 实验 室 成 了 Fab lab 的 分 支 ， 所 以 我 立刻 
报名 参加 了 。 

作者 : 你 当时 学 这 门 课程 感觉 到 吃力 么 ? 

00: 这 门 课程 强度 真 的 很 大 ， 要 在 一 个 学 期 内 学 完 跟 制 造 相 
关 的 知识 ， 包 括 设计 、 建 模 、 编 程 、 电 路 、 制 作 模具 还 有 最 后 的 
组 装 。 当 时 对 制造 的 完整 流程 不 了 解 ， 而 且 每 个 星期 学 的 课程 可 
能 是 大 学 里 半 个 学 期 甚至 是 一 个 学 期 的 内 容 ， 每 次 上 完 课 都 会 发 
现 有 几 十 个 术语 不 知道 是 什么 意思 。 加 上 当时 还 在 创业 阶段 ， 所 
以 上 Fab Academy 课程 的 时 候 ， 还 是 非常 吃力 的 。 
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作者 : 你 觉得 Fab Academy 在 哪个 方面 对 你 来 说 是 有 意义 的 ? 

00: 有 好 几 点 。 一 是 我 对 整个 数字 制造 的 流程 有 了 深入 的 了 
解 。 现 在 看 到 一 些 比 较 有 趣 的 实物 ， 我 大 概 能 猜测 出 它们 的 制作 
方法 。 二 是 我 发 现 制造 并 不 是 一 件 很 难 的 事 ， 当 掌握 了 比较 完整 
的 制造 知识 和 体系 后 ， 每 个 人 都 可 以 动手 实现 自己 的 想法 。 三 是 
我 有 机 会 探索 并 接受 了 很 多 新 鲜 的 事物 ， 例 如 制作 模具 、 数 字 电 
路 还 有 嵌入 式 开发 。 在 整个 学 习 过 程 中， 我 发 现 一 些 感 兴趣 的 领 
域 和 技术 跟 之 前 的 工作 和 项 目 相关 。 例 如 之 前 在 微 信 支付 团队 做 
餐饮 场景 的 时 候 ， 有 考虑 过 用 互动 装置 让 周围 的 用 户 领 优惠 券 ， 
但 是 当时 不 知道 怎么 做 。 在 学 完 这 门 课 程 后 发 现 ， 如 果 当 时 知道 
一 些 传感器 怎么 用 ， 做 个 简单 演示 并 不 难 。 

作者 : Fab Academy 毕业 的 时 候 你 做 了 什么 项 目 ? 

00: 我 当时 做 了 一 个 跟 声音 相关 的 小 机 嚣 人 ， 它 的 眼睛 有 一 
个 测量 距离 的 功能 ， 当 你 用 手掌 挡 在 机 器 人 的 眼睛 前 面 ， 传 感 器 
就 会 把 距离 转换 成 音 高 ， 你 可 以 通过 移动 手掌 来 “ 弹 奏 ” 一 首 简 
单 的 乐曲 。 

作者 : 听 起 来 很 有 趣 ，Fab Academy 对 你 来 说 最 大 的 帮助 是 
什么 ? 

00: 最 大 的 帮助 是 让 我 掌握 了 如 何在 陌生 领域 快速 学 习 并 获 
取 核 心 知识 的 方法 。 当 你 有 明确 的 目标 ， 学 习 就 更 有 针对 性 。 第 
二 点 是 如 何 更 有 效 地 找到 资料 解决 手头 上 的 问题 ， 在 排除 故障 的 
过 程 中 得 到 了 很 多 锻炼 。 第 三 点 是 可 以 进入 创 客 的 圈子 认识 更 多 
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有 趣 的 人 ， 他 们 都 是 有 动手 能 力 解 决 问题 的 人 ， 大 家 相互 帮忙 一 
起 做 东西 的 氛围 特别 好 。 我 之 前 比较 困扰 的 是 ， 为 什么 做 设计 却 
没有 多 少 实现 的 能 力 ? 学 完 这 门 课 ， 自 己 的 动手 能 力 有 了 提升 。 
我 还 是 相信 一 点 , 很 多 东西 要 把 它 实 现 出 来 , 你 的 设计 才 是 完整 的 ， 
这 样 才能 检验 想法 和 设计 理念 是 不 是 对 的 。 如 果 对 Fab Academy 
感 兴趣 的 话 ， 可 以 在 我 的 公众 号 HackYourself 阅读 更 多 资料 。 

作者 : 换 一 个 话题 ， 你 几时 开始 对 AI 感 兴趣 的 ? 

00: 我 对 AI 感 兴趣 也 挺 久 了 。 在 六 七 年 前 我 曾经 做 过 一 段 
时 间 与 搜索 引擎 相关 的 产品 ， 那 个 时 候 算是 比较 早 接触 到 机 器 学 
习 和 大 数据 。 当 时 觉得 这 个 领域 变 有 潜力 的 。 自 己 真正 动手 学 是 
2017 年 ， 因 为 当时 觉得 整个 行业 发 展 的 速度 一 下 子 变 快 ， 有 很 多 
新 技术 冒 出 来 ， 所 以 去 上 了 Udacity 的 深度 学 习 课程 ， 希 望 通过 
写 代码 做 出 完整 项 目的 方式 深入 地 了 解 现 在 的 AI 是 什么 。 

作者 : Udacity 的 深度 学 习 课程 我 也 学 过 一 阵子 ， 有 计算 机 专 
业 背 景 的 我 都 觉得 挺 难 入 门 的 ， 你 当时 是 怎么 学 习 这 门 课 程 并 跨 
过 这 个 门槛 的 ? 

00: 深度 学 习 对 数学 的 要 求 比 其 他 技术 课程 要 高 ， 所 以 我 花 
了 挺 多 精力 复习 一 些 数学 基础 知识 。 为 了 让 自己 对 数学 的 兴趣 浓 
厚 一 些 ， 还 去 阅读 了 一 些 比较 有 趣 的 数学 科普 书 ， 同 时 找 了 一 些 
好 玩 的 视频 让 自己 对 数学 和 深度 学 习 里 的 知识 有 更 深入 的 了 解 。 
当 数 学 基础 有 所 提升 ， 理 解 深度 学 习 的 知识 就 没有 以 前 困难 了 。 
第 二 点 是 编程 的 基础 ， 我 虽然 学 过 Python， 但 没有 多 少 写 代 码 的 
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经 验 ， 所 以 基础 还 是 很 弱 。 因 为 这 门 课程 需要 写 不 少 代码 ， 所 以 
我 也 在 不 断 地 积累 和 提升 自己 的 编程 能 力 。 第 三 点 是 Udacity 在 
课程 设计 上 降低 了 很 多 门槛 。 它 把 一 些 知识 点 之 间 的 跨度 拆 得 比 
较 细 ， 在 两 个 大 的 台阶 中 间 搭 了 很 多 小 的 台阶 ， 让 你 在 理解 某 个 
很 难 的 知识 点 的 时 候 能 够 循序 渐进 ， 最 后 再 设计 一 些 题目 让 你 
练习 。 

作者 : 当 你 学 完 这 门 深度 学 习 课 程 ， 你 觉得 深度 学 习 对 你 的 
设计 思维 有 什么 改变 吗 ? 

00: 我 觉得 学 习 技 术 对 设计 是 有 帮助 的 ， 从 几 个 方面 来 看 。 
第 一 个 是 思维 。 编 程 思 维 可 以 帮助 非 理 工科 背景 的 设计 师 了 解 什 
么 是 抽象 、 复 用 、 结 构 化 和 参数 化 ， 这 些 都 是 编程 的 思考 方式 。 
例如 设计 师 要 搭建 组 件 库 或 者 整理 设计 规范 的 时 候 ， 要 考虑 怎么 
把 最 开始 看 起 来 很 杂乱 的 元 素 抽 取出 来 形成 多 种 模式 ， 这 些 思维 
就 非常 重要 了 。 第 二 个 是 原理 。 如 果 你 知道 深度 学 习 的 一 些 原理 ， 
它 到 底 能 实现 什么 ， 不 能 实现 什么 ， 它 的 能 力 范围 到 底 在 哪里 ， 

当 你 以 后 用 到 深度 学 习 ， 就 大 概 知道 你 要 做 的 设计 界限 在 哪 。 例 如 ， 

这 门 课程 最 后 的 项 目 是 基于 一 个 人 脸 图 像 库 ， 用 GAN 〈 生 成 对 抗 
网 络 ) 来 自动 生成 人 脸 。 这 个 看 起 来 应 用 的 范围 蛮 广 的 ， 但 真正 
做 过 一 遍 以 后 ， 你 可 能 会 有 更 多 的 考虑 。 例 如 数据 集 从 哪里 来 ? 
是 有 现成 的 数据 集 还 是 手动 获取 一 批 ? 如 果 你 手动 获取 的 数据 集 
样本 量 很 少 , 基本 不 用 想 自动 生成 人 脸 这 事 了 ; 即便 数据 量 很 大 ， 
当 你 发 现 最 终结 果 人 脸 是 下 的， 你 就 会 知道 这 套 技术 还 没 成 熟 ， 
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没 法 达到 要 求 ， 那 你 可 能 不 会 把 它 用 到 设计 里 。 所 以 ， 深 度 学 习 
需要 考虑 数据 集 是 否 够 多 、 设 定 的 目标 和 打分 规则 是 否 明确 ， 这 
些 因 素 都 会 直接 影响 设计 目标 的 实现 。 真 正 动手 学 习 以 后 ， 才 会 
更 加 清楚 深度 学 习 能 不 能 解决 设计 问题 。 

作者 : 那 你 觉得 深度 学 习 会 不 会 影响 到 界面 的 设计 ? 

00: 设计 包含 的 范围 很 广 ， 界 面 设计 也 不 是 只 有 画图 的 部 分 。 
我 觉得 它 的 影响 没有 那么 直接 ， 更 深层 的 影响 可 能 会 是 改变 使 用 
场景 。 例 如 有 一 些 流程 ， 之 前 需要 用 户 填 写 一 些 必 填 信息 才能 跳 
到 下 一 步 , 但 如 果 通 过 AI 技术 基于 用 户 的 历史 数据 做 分 析 和 判断 ， 
整个 信息 填写 可 能 就 不 需要 了 ， 这 就 会 影响 到 整个 交互 流程 。 如 
果 一 些 具体 的 界面 包含 了 各 种 重复 性 的 工作 ， 或 者 它 的 产 出 物 比 
较 类 似 ， 这 时 候 你 可 以 用 更 自动 化 的 方式 去 实现 ， 而 不 是 每 一 个 
操作 都 需要 人 工 去 做 。 

随 着 AI 的 成 熟 ， 一 些 流程 操作 可 能 会 有 新 的 替代 做 法 ; 如果 
技术 更 成 熟 的 话 ， 有 可 能 整个 场景 和 流程 都 需要 去 重新 设计 ， 这 
个 时 候 界面 有 可 能 会 消失 。 

作者 : 那 你 怎么 看 待 现在 的 AI ? 现在 的 AI 是 不 是 等 于 深度 
学 习 ? 

00: AI 肯定 不 只 是 深度 学 习 。AI 一 直 以 来 都 在 发 展 ， 例 如 
最 早 的 垃圾 邮件 过 滤 、 个 性 化 推荐 系统 、 微 信 语 音 转 文字 等 ， 都 
属于 很 典型 的 AI 应 用 。 当 一 个 技术 成 熟 并 且 广 泛 应 用 后 ， 我 们 就 
觉得 它 “ 不 是 ”AI 了 。 现 在 的 运算 能 力 越 来 越 强 ， 通 过 计算 自动 
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生成 的 东西 越 来 越 多 ， 例 如 鹿 班 自动 生成 一 张 Banner。 在 技术 攻 
坚 和 推广 阶段 ， 大 家 会 更 倾向 于 认为 这 是 “当前 的 ”AI。 我 觉得 
其 实 本 质 都 是 一 样 的 ，AI 就 是 用 计算 的 方式 ， 自 动 化 解决 一 些 问 
题 或 生成 最 终 想 要 的 结果 。 

作者 : 现在 很 多 设计 师 都 在 担心 自己 会 被 AI 取代 。 你 怎么 看 
待 这 个 问题 ? 

00: 这 个 问题 我 思考 也 蛮 久 了 。UI 和 交互 设计 近 几 年 发 展 得 
特别 快 ， 大 家 已 经 把 一 些 基础 知识 和 相关 经 验 总 结 得 很 好 了 ， 可 
复 用 的 组 件 和 模块 越 来 越 多 ， 所 以 以 后 设计 师 都 不 需要 “从 零 开 
始 ”， 工 作 看 起 来 是 变 少 了 。 但 我 认为 这 也 是 好 的 一 面 。 你 需要 
更 深入 地 看 待 设计 本 身 ， 到 底 哪些 部 分 需要 由 人 来 解决 和 设计 。 
对 于 真正 的 设计 难题 ， 我 认为 机 器 很 难 替 代 设 计 师 ， 因 为 这 些 设 
计 难 题 都 是 由 于 设计 对 象 关系 之 间 的 复杂 性 ， 以 及 人 本 身 的 不 确 
定性 引起 的 。 例 如 要 去 设计 一 个 服务 解决 方案 ， 我 觉得 最 重要 的 
是 如 何 理 清 不 同 利益 相关 者 之 间 的 利益 关系 。 服 务 设计 一 般 要 面 
对 很 多 不 同 的 角色 ， 他 们 之 间 的 关系 是 错综复杂 的 ， 在 设计 时 不 
能 只 考虑 某 个 环节 和 流程 ， 而 需要 更 多 考虑 全 局 和 关系 的 平衡 。 
各 种 微妙 、 复 杂 、 不 明确 的 关系 ， 对 机 器 来 说 是 一 个 很 难 的 问题 ， 
这 时 候 就 需要 人 去 把 握 。 我 觉得 “AI 是 否 能 取代 设计 师 ” 这 个 问 
题 ， 能 让 设计 师 更 多 地 去 思考 到 底 设 计 要 解决 的 问题 是 什么 ， 然 
后 把 机 器 擅长 的 事情 或 者 不 需要 人 太 多 思考 的 事情 交 给 机 器 去 做 。 
其 实 这 样 也 很 好 ， 设 计 师 不 用 天 天 坐 在 计算 机 前 面 做 对 齐 几 个 像素 
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的 事情 。 在 学 完 深度 学 习 课程 以 后 ,我 了 解 了 现在 AI 的 界限 在 哪 ， 
但 是 它 的 潜力 还 很 大 ， 人 真 的 不 应 该 再 跟 机 器 去 比 了 。 

作者 : 那 你 觉得 现在 的 AI 的 界限 在 哪里 ? 

00: 现在 AI 的 局 限 蛮 多 的 ， 但 是 以 后 会 越 来 越 少 。 只 要 你 
能 够 给 一 个 明确 的 目标 ， 这 个 目标 可 操作 、 可 量化 ， 可 以 提供 算 
法 和 足够 的 训练 数据 ， 基 本 上 AI 都 能 够 做 到 。 在 未 来 ， 机 器 能 够 
做 到 的 绝 大 部 分 事情 ， 人 都 不 会 做 得 比 机 器 好 ， 尤 其 是 那些 可 以 
标准 化 、 量 化 的 事情 。 毕竟 人 有 各 种 各 样 的 生理 局 限 , 会 死 、 会 累 。 
那 这 个 时 候 怎 么 办 ? 我 觉得 最 终 基本 只 剩 下 一 条 路 ， 就 是 人 要 去 
做 自己 真正 喜欢 的 事情 ， 即 便 那个 事情 机 器 能 够 做 得 比 你 好 100 
倍 ， 你 还 是 会 愿意 去 做 。 当 你 一 直 做 这 个 事情 ， 迟 早 会 发 现 有 一 
些 机 器 不 擅长 或 者 不 居于 去 做 的 部 分 ， 这 时 候 你 做 的 东西 可 能 会 
因为 个 人 偏好 影响 到 结果 , 而 这 个 结果 会 被 其 他 人 感知 或 者 喜欢 ， 
这 时 候 你 就 创造 了 属于 “人 ”的 价值 。 最 近 一 段 时 间 我 在 想 ， 做 
设计 还 是 需要 找到 一 个 领域 ， 结 合 这 个 领域 去 做 你 喜欢 的 东西 。 
有 了 领域 这 个 框架 ， 很 多 新 的 发 现 都 会 来 自 于 你 对 那个 领域 的 理 
解 和 积累 。 想 要 在 某 个 领域 真正 产生 价值 ， 需 要 沉浸 其 中 ， 有 足 
够 多 的 认识 和 积累 才能 做 到 。 所 以 ， 如 果 想 用 AI 技术 达到 目的 ， 
或 是 提升 产品 的 价值 和 效率 ,你 就 要 在 这 个 领域 多 去 学 习 、 实 践 、 
领悟 。 这 是 我 最 近 的 感受 。 

作者 : 所 以 你 现在 寻找 的 领域 是 什么 ? 我 记得 你 在 研究 AI 和 
音乐 如 何 结合 。 
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00: 主要 是 多 媒体 互动 吧 。 我 认为 体验 还 是 会 回 到 实体 场 
景 下 ， 虽 然 它 们 不 一 定 是 “真实 的 ”， 但 一 定 会 越 来 越 强 调 “ 沉 
浸 ”。 那 么 设计 就 会 涉及 实体 环境 和 各 种 感官 ， 所 以 我 想 往 沉浸 
式 互 动 这 个 方向 探索 更 多 的 设计 。 声 音 和 音乐 在 沉浸 式 体验 中 不 可 
或 缺 ， 也 是 我 一 直 比 较 感 兴趣 的 领域 ， 所 以 我 想 探索 AI 和 音乐 如 
何 更 好 地 结合 。 当 开始 深入 到 一 个 领域 中 ， 你 会 发 现 有 一 些 东西 
是 多 年 都 不 会 变 的 ， 即 便 AI 来 了 ， 它 还 是 不 会 变 的 。 只 有 深入 理 
解 一 些 本 质 , 你 才 可 能 用 新 的 技术 去 实现 突破 , 做 出 好 玩 的 东西 。 

作者 : 我 觉得 不 会 变 的 第 一 应 该 是 艺术 ， 音 乐 属于 艺术 。 

00: 其 实 每 个 领域 都 有 一 些 比较 底层 的 东西 不 会 改变 ， 这 个 
需要 你 对 这 个 领域 的 理解 。 

作者 : 那 你 对 现在 研究 的 AI 和 音乐 的 结合 有 什么 心得 吗 ? 

00: 如 果 用 工程 的 角度 去 看 待 音乐 ， 它 其 实 跟 数 学 还 有 编程 
有 密切 的 关系 。 如 果 把 声音 还 原 为 一 种 物理 现象 ， 它 更 多 是 力学 
研究 的 对 象 ， 甚 至 跟 电学 和 光学 的 原理 有 不 少 相 通 之 处 。 从 这 个 
角度 出 发 理解 声音 跟 音 乐 之 后 ， 你 可 以 尝试 加 入 一 些 新 的 元 素 ， 
例如 借助 AI 做 出 更 多 有 趣 、 可 以 互动 的 声乐 装置 。 我 现在 还 在 新 
手 阶段 ， 学 习 基 础 知识 和 相关 的 工具 。 工 具 会 在 很 大 程度 上 局 限 
你 想 要 实现 的 东西 ， 尤 其 是 在 一 个 全 新 的 领域 。 

作者 : 我 认为 后 面 的 工具 使 用 起 来 肯定 会 越 来 越 简单 。 

00: 我 认为 工具 的 复杂 程度 ， 取 决 于 你 想 解决 哪个 层面 的 问 
题 。 就 好 比 说 你 想 要 弹出 十 个 音符 ， 那 你 的 工具 可 以 特别 简单 ， 
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用 一 个 iPad 或 者 几 个 按键 ， 发 出 声音 就 可 以 了 。 但 如 果 你 要 从 物 
理 的 角度 控制 整个 声音 ， 那 工具 可 能 会 非常 复杂 ， 需 要 调控 的 参 
数 会 随 着 程序 的 灵活 度 而 成 倍增 加 。 

作者 : 你 怎么 看 待 设计 师 后 面 的 发 展 ? 

00: 一 个 就 是 刚才 我 说 的 ， 一 定 要 找到 自己 真正 感 兴趣 的 领 
域 。 不 论 那个 领域 是 什么 ， 现 在 看 起 来 有 没有 前 景 ， 但 只 要 是 你 
喜欢 的 领域 ， 我 觉得 就 应 该 坚持 沉浸 进去 ， 去 学 习 、 去 玩 、 去 做 
东西 。 第 二 个 就 是 ， 不 论 是 设计 还 是 其 他 领域 都 一 样 ， 基 本 上 属 

于 T 型 人 才 的 问题 。 你 需要 去 学 习 跟 设计 相关 和 不 相关 的 所 有 知 
识 ， 一 切 都 是 为 了 做 好 T 字 的 那 一 坚 ， 这 样 你 对 设计 的 理解 才 会 

更 深 。 要 发 现 自己 真正 喜欢 的 领域 是 什么 ， 然 后 基于 那个 领域 ， 
慢 慢 地 往 横向 和 纵向 深入 发 展 。 第 三 点 就 是 ， 我 现在 处 于 一 个 
标 不 太 明 确 的 阶段 ， 如 何 找 到 一 个 让 你 相对 长 期 聚焦 的 领域 ， 以 
及 能 不 断 帮 你 精进 某 些 技能 和 经 验 的 实践 项 目 , 这 个 也 蛮 重 要 的 。 

作者 : 那 你 觉得 设计 师 要 怎么 才能 拓宽 自己 的 视野 ? 

00: 第 一 点 还 是 刚才 说 的 ， 基 于 内 在 驱动 力 ， 基 于 兴趣 不 停 
地 向 外 扩展 。 一 旦 对 某 个 事物 感 兴趣 ， 你 就 会 不 自觉 地 想 要 知道 
更 多 ， 会 开始 比较 ， 想 要 看 到 和 找到 更 好 的 东西 。 第 二 点 3 
我 觉得 设计 师 的 审美 来 自 于 生活 的 方方面面 。 当 你 其 他 方面 的 能 
力 和 见识 有 所 拓宽 ， 设 计 能 力 和 视野 也 会 提升 。 所 以 要 多 去 体验 
不 同 的 事物 ， 体 验 那些 以 前 没 看 过 、 没 玩 过 、 没 做 过 的 事情 。 还 
有 第 三 点 ， 过 去 两 年 我 在 做 心理 学 相关 的 项 目 ， 发 现 对 人 、 事 、 
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物 的 洞察 ， 很 大 程度 上 来 自 于 你 对 人 的 复杂 程度 的 理解 ， 以 及 对 
自己 的 觉察 跟 反 思 。 有 时 候 看 待 事物 或 问题 ， 如 果 没 有 结合 自己 
关注 的 事物 或 领域 一 起 去 理解 的 话 ， 可 能 会 缺少 一 条 主线 。 我 们 
对 很 多 知识 和 事物 的 看 法 就 有 点 像 一 棵 树 ， 它 们 最 终 会 还 原 到 某 
个 更 加 本 质 的 东西 ， 就 是 这 棵 树 的 主干 ， 例 如 你 对 自己 本 性 的 理 
解 ， 或 者 是 你 在 这 个 世界 上 一 直 坚 持 的 立场 和 态度 。 如 果 没 有 这 
个 立场 ， 你 可 能 就 没有 属于 自己 的 原则 、 观 点 和 偏好 。 如 果 没有 
自己 的 价值 观 ， 你 可 能 也 没有 办 法 把 很 多 东西 整合 起 来 ， 最 终 把 
它 变 成 你 自己 的 东西 ， 或 者 基于 它 去 创造 价值 。 
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1.“ 去 中 心 化 ”的 互联 网 


互联 网 的 前 身 叫 作 阿 帕 网 ， 属 于 美国 国防 部 20 世纪 60 年 代 
部 署 的 一 个 中 央 控 制 型 网 络 。 阿 帕 网 有 一 个 明显 的 弱点 : 如 果 中 
央 控 制 系统 受到 攻击 ， 整 个 阿 帕 网 就 会 竣 病 。 为 了 解决 这 个 问题 ， 
美国 的 Paul Baran 开发 了 一 套 新 型 通信 系统 。 该 系统 的 主要 特色 
是 如 果 部 分 系统 被 摧毁 ， 整 个 通信 系统 仍 能 够 保持 运行 。 它 的 工 
作 原 理 是 这 样 的 : 中 央 控 制 系统 不 再 简单 地 把 数据 直接 传送 到 目 
的 地 ， 而 是 在 网 络 的 不 同 节 点 之 间 传 送 ， 如 果 其 中 某 个 节点 损坏 ， 
则 别 的 节点 能 够 马上 代替 其 运行 。 阿 帕 网 的 相关 实践 和 研究 ， 催 
生出 现代 意义 上 的 互联 网 。 

互联 网 的 起 源 就 是 为 了 去 中 心 化 ， 可 以 使 信息 更 安全 、 更 高 
效 地 传播 。 可 惜 在 第 一 次 互联 网 泡沫 之 后 ， 人 们 开始 意识 到 在 互 
联网 上 创造 价值 的 捷径 是 搭建 中 心 化 服务 ， 收 集 信息 并 将 之 货币 
化 。 互 联网 上 逐渐 出 现 了 不 同 领域 的 巨头 ， 它 们 以 中 心 化 的 形式 
影响 着 亿 万 用 户 ， 例 如 社交 网 络 Facebook、 搜 索引 擎 Google 等 。 
用 户 使 用 他 们 的 产品 进行 社交 或 者 搜索 ， 而 作为 服务 提供 商 的 巨 
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头 们 通过 掌握 和 分 析 用 户 数据 进而 优化 自己 的 产品 并 获得 利益 。 
为 了 给 用 户 提供 更 好 的 服务 , 存储 和 分 析 用 户 数据 本 来 无 可 厚 非 ， 
但 这 也 引起 了 一 部 分 对 自己 的 隐私 安全 敏感 的 用 户 的 不 满 。 但 更 
重要 的 一 点 是 ， 如 果 某 个 巨头 突然 垮 了 停止 了 相关 服务 ， 会 给 用 
户 的 生活 带 来 极 大 的 困扰 。 

貌似 又 回 到 了 20 世纪 60 年 代 ， 很 多 老 一 辈 互 联网 参与 者 重 
新 开始 讨论 去 中 心 化 的 互联 网 ， 他 们 认为 互联 网 去 中 心 化 的 核心 
概念 是 服务 的 运行 不 再 盲目 依赖 于 单一 的 垄断 企业 ， 服 务 运营 的 
责任 将 分 散 承 担 。 

Tim Berners-Lee 万维网 的 发 明 者 ) 提出 了 自己 的 见解 : “将 
网 络 设计 成 去 中 心 化 的 ， 每 个 人 都 可 以 参与 进来 ， 拥 有 自己 的 域 
名 和 网 络 服 务 器 ， 只 是 目前 还 没有 实现 。 目 前 的 个 人 数据 被 垄断 了 。 
我 们 的 想法 是 恢复 去 中 心 化 网 络 的 创意 。” 

我 们 再 看 看 去 中 心 化 网 络 的 三 个 核心 优势 : 隐私 性 、 数 据 可 
迁移 性 和 安全 性 。 

(1) 隐私 性 : 去 中 心 化 对 数据 隐私 性 要 求 很 高 。 数 据 分 布 在 
网 络 中 ， 端 到 端 加 密 技术 可 以 保证 授权 用 户 的 读 写 权 限 ， 数 据 获 
取 权 限 用 算法 控制 。 而 中 心 化 网 络 则 一 般 由 网 络 所 有 者 控制 ， 包 
括 消费 者 描述 和 广告 定位 。 

(2) 数据 可 迁移 性 : 在 去 中 心 化 环境 下 ， 用 户 拥有 个 人 数据 ， 
可 以 选择 共享 对 象 ， 而 且 不 受 服 务 供应 商 的 限制 (如 果 还 存在 服 
务 供应 商 的 概念 ) 。 这 点 很 重要 ， 如 果 你 想 换 车 ， 为 什么 不 可 以 


= 


| Al 改变 设计 | 人 工 智能 时 代 的 设计 师 生存 手册 


迁移 自己 的 个 人 驾驶 记录 呢 ?” 聊 天 平台 记录 和 医疗 记录 同 理 。 

(3) 安全 性 : 在 中 心 化 环境 下 ， 越 孤立 的 优良 环境 越 是 吸引 
破坏 者 。 去 中 心 化 环境 的 本 质 决定 了 其 安全 性 可 以 抵御 黑客 攻击 、 
渗透 、 信 息 盗 窃 、 系 统 奔 溃 等 漏洞 ， 因 为 从 一 开始 它 的 设计 就 保 
证 了 公众 的 监督 。 

近 几 年 很 火 的 HBO 剧 集 《 硅 谷 》 以 “互联 网 去 中 心 化 ”这 个 
理念 开始 了 第 四 季 内 容 。 怪 人 风 投 家 Russ Hanneman 询问 陷入 困 
境 的 Pied Piper 创始 人 Richard Hendricks， 如 果 给 予 他 无 限 的 时 
间 和 资源 ， 他 想 要 构建 什么 。Hendricks 回答 : “一 个 全 新 的 互 
联网 ”， 他 随后 解释 说 , “现在 每 台 手 机 的 运算 能 力 都 比 人 类 登 
月 时 的 手机 要 强大 得 多 ， 如 果 你 能 用 所 有 的 几 十 亿 合 手机 构建 一 
个 巨大 的 网 络 ， 使 用 压缩 算法 将 一 切 变 得 更 小 更 高 效 ， 更 方便 地 
转移 数据 ， 那 么 我 们 将 能 构建 一 个 完全 去 中 心 化 的 互联 网 ， 没 有 
防火 墙 ， 没 有 过 路 费 ， 没 有 政府 监管 ， 没 有 监视 ， 信 息 将 会 完 
自由 。” 

在 后 面 的 剧情 中 ，Pied Piper 在 Hooli 大 会 上 将 Dan Melcher 
的 几 干 TB 数据 转移 到 25 万 人 台 手 机 上 。 其 间 发 生 了 一 系列 问题 ， 
最 后 Dan Melcher 的 数据 被 “神奇 ”地 备份 到 3 万 台 智 能 冰箱 的 
巨型 网 络 上 。 

互联 网 档案 馆 的 创始 人 Brewster Kahle 曾 表示 ， 互 联网 去 中 
心 化 在 实际 中 很 难 被 执行 ， 仍 有 很 漫长 的 路 要 走 。 虽 然 《 硅 谷 》 
只 是 一 部 电视 剧 ， 里 面 有 部 分 技术 纯 属 虚构 ， 但 是 它 也 侧面 证 实 
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了 一 个 事实 一 每 一 台 手 机 的 运算 能 力 和 性 能 除了 打 电 话 、 聊 天 、 
玩 游戏 外 ， 还 能 做 到 很 多 事情 ， 例 如 成 为 新 一 代 微型 服务 器 和 计 
算 中 心 。 


2. 最 合适 的 私人 服务 器 


手机 成 为 新 一 代 微 型 服务 器 ， 这 也 符合 Tim Berners-Lee“ 每 
个 人 都 拥有 自己 的 网 络 服 务 器 ”的 观点 。 目 前 手机 的 性 能 和 容量 
已 经 可 以 媲美 一 全 人 台式 计算 机 ， 更 重要 的 是 ， 为 了 减少 对 CPU 的 
压力 ， 手 机 拥有 不 同 的 协 处 理 器 。 协 处 理 器 各 司 其 职 ， 专 门 为 手 
机 提供 不 同 的 特色 功能 ， 例 如 iPhone 从 5s 开始 集成 了 运动 协 处 
理 器 ， 它 能 低 功 耗 监测 并 记录 用 户 的 运动 数据 ，MotoX 搭载 的 协 
处 理 器 可 以 通过 识别 你 的 语音 来 处 理 运动 信息 ， 从 而 在 未 唤醒 状 
态 下 使 用 Google now 功能 。 

手机 上 各 种 传感器 可 以 从 不 同 维度 监测 用 户 数据 ， 如 果 手 机 
成 为 下 一 代 微 型 服务 器 ， 那 么 它 需 要 承担 存储 用 户 数据 的 责任 。 
同时 ， 鉴 于 人 工 智能 助手 需要 每 个 用 户 海量 的 数据 作为 基础 ， 才 
能 更 好 地 理解 用 户 并 实时 提供 帮助 ， 成 为 “ 千 人 干 面 ”的 个 人 助理 ， 
所 以 手机 存储 和 分 析 用 户 数据 是 人 工 智 能 助手 的 基础 。 

分 析 用 户 的 非 结构 化 数据 需要 大 量 的 计算 ， 为 了 降低 对 CPU 
和 电池 的 压力 ， 手 机 需要 一 块 低 功 耗 、 专 门 分 析 用 户 数据 的 协 处 
理 器 。 它 能 够 低 功 耗 地 进行 深度 学 习 、 迁移 学 习 等 机 器 学 习 方 法 ， 
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对 用 户 的 海量 非 结 构 化 数据 进行 分 析 、 建 模 和 处 理 。 

家 庭 也 需要 一 个 更 大 容量 的 服务 器 来 减少 手机 的 存储 压力 ， 
例如 24 小 时 长 期 工作 的 冰箱 、 路 由 器 或 者 智能 音箱 都 是 能 够 很 好 
地 承载 数据 的 容器 。 用 户 手 机 可 以 定期 将 时 间 较 长 远 的 数据 备份 
到 家 里 的 服务 器 ， 这 样 的 方式 有 以 下 好 处 : 

(1) 降低 了 手机 里 用 户 数据 的 使 用 空间 ; 

(2) 家 庭 服务 器 会 24 小 时 稳定 工作 ， 可 以 承担 更 多 、 更 复杂 
的 计算 ， 并 将 结果 反馈 给 移动 端 ; 

(3) 用 户 手机 等 设备 更 换 上 时， 可 以 无 颖 使 用 现 有 功能 。 

Google 在 2015 年 已 经 开始 使 用 自家 研发 的 TPU， 它 在 深度 
学 习 的 运算 速度 上 比 当 前 的 CPU 和 GPU 快 15 ~ 30 售 ， 性 能 功 
耗 比 高 出 约 30 ~ 80 倍 。 当 手机 、 智 能 音箱 等 设备 拥有 与 TPU 类 
似 的 协 处 理 器 时 ， 个 人 人 工 智 能 助理 会 到 达 新 的 顶峰。 在 2017 年 
9 月 ， 华 为 发 布 了 全 球 第 一 款 AI 移动 芯片 麒麟 970， 其 AI 性 能 
密度 大 幅 优 于 CPU 和 GPU。 在 处 理 同样 的 AI 应 用 任务 时 ， 相 
较 于 四 个 Cortex-A73 核心 ， 麒 麟 970 的 新 异 构 计算 架构 拥有 大 
约 50 倍 能 效 和 25 倍 性 能 优势 ， 这 意味 未 来 在 手机 上 处 理 AI 任 
务 不 再 是 难事 。 更 厉害 的 是 ，iPhone X 的 All 仿生 芯片 拥有 神 
经 引擎 ， 每 秒 运算 次 数 最 高 可 达 6000 亿 次 。 它 是 专 为 机 器 学 习 
而 开发 的 硬件 ， 不 仅 能 执行 神经 网 络 所 需 的 高 速 运算 ， 而 且 具 有 
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3. 数据 的 进一步 利用 


人 工 智 能 的 发 展 依赖 于 大 数据 、 高 性 能 的 运算 能 力 和 实现 
架 ， 数 据 是 人 工 智 能 的 基础 。 在 过 去 30 年 里 ， 人 类 数据 经 历 了 两 
个 阶段 一 一 孤岛 阶段 和 集体 阶段 。 

(1) 孤岛 阶段 。 在 没有 互联 网 时 期 及 互联 网 前 期 ， 人 类 使 用 
计算 机 基本 处 于 单机 状态 ， 数 据 也 只 能 存储 在 计算 机 本 地 。 由 于 
计算 机 性 能 较 差 ， 产 品 较为 简单 以 及 技术 的 不 成 熟 ， 人 类 在 计算 
机 上 产生 的 数据 价值 不 大 。 

(2) 集体 阶段 。 在 互联 网 中 后 期 ， 计 算 机 行业 开始 往 互 联网 发 
展 并 衍生 出 更 多 领域 ， 例 如 网 上 社交 、 搜 索 等 ， 视 频 、 音 乐 等 娱乐 
行业 也 开始 互联 网 化 ， 到 了 移动 互联 网 时 代 ， 巨 头 们 结合 传统 行业 
产生 出 更 多 的 玩法 。 人 类 每 天 的 活动 逐渐 创造 出 庞大 的 数据 。 

由 于 数据 的 庞大 以 及 技术 有 限 ， 个 人 没有 能 力 对 自己 的 数据 
进行 存储 和 分 析 ， 个 人 数据 对 个 人 来 讲 仍然 价值 不 大 ， 但 对 于 巨 
头 来 说 就 不 一 样 了 。 巨 头 们 有 的 是 资金 和 技术 ， 即 使 个 人 数据 拥 
有 太 多 特征 ， 但 放 在 一 起 成 为 群体 数据 时 ， 巨 头 们 就 可 以 通过 数 
据 清 洗 、 建 模 等 方法 分 析出 相关 群体 的 普遍 特征 ， 得 出 相关 的 用 
户 画 像 ， 更 了 解 自己 的 用 户 是 谁 ， 从 而 设计 出 更 有 针对 性 的 功能 
和 服务 ， 探 索 出 新 的 用 户 需 求 和 衍生 出 新 的 产品 。 

随 着 近 几 年 技术 的 成 熟 ， 巨头 们 可 以 做 到 一 些 相对 简单 的 个 
人 推荐 。 如 亚马逊 ， 它 可 以 根据 你 的 购买 记录 推荐 相关 商品 ， 这 
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也 是 通过 分 析 大 量 的 用 户 购 买 数据 实现 的 。 

由 于 服务 器 普遍 昂贵 以 及 普通 用 户 缺乏 对 数据 处 理 的 能 力 ， 
而 巨头 们 有 能 力 使 用 户 数据 发 挥 更 大 价值 ， 所 以 用 户 数据 一 直 
“默许 ”被 Google、Facebook、 苹 果 、 腾 讯 、 阿 里 、 百 度 等 巨头 
收集 着 ， 这 是 可 以 理解 的 。 每 个 用 户 一 天 产生 的 数据 包括 了 社 
交 、 健 康 、 购 物 、 地 理 信息 等 ， 但 是 巨头 们 的 垄断 和 相互 竞争 ， 
导致 用 户 数据 被 各 巨头 分 割 和 收集 使 用 ， 再 加 上 巨头 们 宁愿 生产 
更 多 的 产品 进行 竞争 也 不 愿意 使 用 户 数据 互通 ， 导 致 用 户 数据 发 
挥 不 出 更 大 的 价值 。 这 也 是 人 工 智 能 发 展 道路 上 的 一 大 障碍 。 

(3) 互通 阶段 。 若 要 使 人 工 智 能 得 到 更 快 发 展 ， 需 要 分 析 和 
了 解 更 多 的 完整 数据 ， 加 上 互联 网 去 中 心 化 的 理念 ， 应 用 厂商 把 
数据 “还 给 ”用 户 将 会 是 下 一 个 趋势 。 把 数据 “还 给 ”用 户 的 意 
思 不 是 指 应 用 厂商 不 应 该 拥有 数据 ， 而 是 强调 将 数据 共享 出 去 ， 
从 而 获得 更 多 有 用 的 数据 。 

但 让 各 个 应 用 厂商 共享 数据 ， 不 符合 竞争 的 现实 。 这 时 候 用 
户 需要 一 个 数据 仓库 ， 它 能 存储 和 整理 不 同 应 用 厂商 的 数据 ， 而 
人 工 智 能 可 以 利用 数据 进行 自我 优化 和 分 析出 该 名 用 户 的 特征 。 
例如 我 们 手机 里 的 淘宝 和 京东 ， 用 户 使 用 它们 时 的 动机 和 场 
景 不 一 样 ， 所 以 它们 所 得 的 用 户 画像 仅 是 该 名 用 户 的 一 部 分 ， 不 
能 完全 代表 该 名 用 户 。 如 果 淘 宝 和 京东 将 各 自 的 数据 保存 到 个 人 
数据 仓库 ， 人 工 智 能 将 数据 整理 完 后 再 为 淘宝 和 京东 输出 已 授权 
的 完整 用 户 画 像 ， 那 么 淘宝 和 京东 就 可 以 为 该 名 用 户 提供 更 多 的 
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个 性 化 服务 ， 创 造 更 多 收益 。 这 也 实现 了 应 用 厂商 为 人 工 智能 提 
供 数据 ， 人 工 智 能 反哺 应 用 厂商 的 良性 循环 。 


4. 人 工 智 能 数据 仓库 设计 


2015 年 堪 称 “智能 家 居 元 年 ”， 但 最 后 还 是 渐渐 沉寂 了 。 通 
俗 理解 的 话 , 智能 家 居 的 重点 是 “智能 ”, 而 人 工 智能 没有 发 展 起 来 ， 
智能 家 居 如 何 “ 智 能 ”? 

现在 大 部 分 智能 家 居 电 器 就 像 一 个 孤岛 ， 只 能 通过 手机 里 的 
不 同 App 操控 ， 相 互 之 间 没 有 任何 联动 ， 根 本 体现 不 出 智能 家 居 
的 概念 ， 直 至 小 米 打破 了 现 有 状况 。 

小 米 通过 MIUI、 路 由 器 和 小 米 生 态 链 布 局 智能 家 居 生 态 ， 前 
期 通过 路 由 器 掌控 联网 大 权 ， 通 过 小 米 电视 占据 家 庭 娱乐 中 心 ， 
运用 Wi-Fi 插座 使 基础 家 电 智 能 化 ， 各 种 传感器 使 建筑 智能 化 ; 
中 期 通过 与 科技 企业 如 美的 的 合作 ， 推 出 小 米 生 态 链 的 各 种 产品 
如 扫地 机 器 人 、 空 气 净化 器 、 电 饭 煲 等 ， 由 小 米 控 制 的 智能 家 居 
不 断 渗透 到 用 户 家 里 ;而 2017 年 7 月 推出 的 299 元 的 小 米 AI 音 
箱 使 小 米 智 能 家 居 达 到 一 个 新 的 高 潮 ， 控 制 智能 家 居 变 得 更 为 简 
单 ， 用 户 可 以 通过 AI 音箱 对 各 产品 下 达 指 令 和 操控 。 至 今 为 止 ， 
在 国内 智能 家 居 布 局 最 出 色 的 是 小 米 。 

尽管 如 此 ， 目 前 小 米 的 智能 家 居 布 局 仍 处 于 初级 阶段 ， 只 是 
把 不 同 电 器 互联 化 并 连接 一 个 终端 。 家居 的 智能 不 只 是 简 简 单单 
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地 通过 命令 操作 就 行 ， 更 多 在 于 智能 家 居 之 间 的 联动 以 及 更 懂 主 
人 ， 这 靠 的 是 对 用 户 数 据 的 积累 、 理 解 和 分 享 ;， 但 这 也 带 来 一 些 
隐私 问题 ， 用 户 担心 如 果 产 品 和 人 工 智能 接触 到 更 多 数据 ， 自 己 
的 生活 会 像 被 24 小 时 监控 着 。 人 工 智能 将 会 是 科学 与 伦理 博弈 中 
最 激烈 的 一 环 ， 所 以 如 何 实现 底层 的 数据 仓库 是 关键 。 

未 来 的 人 工 智能 和 数据 仓库 应 该 是 一 个 平台 ， 就 像 现 在 的 操 
作 系 统 Windows、iOS 和 Android， 但 数据 仓库 不 应 该 被 巨头 们 和 
政府 掌控 , 因为 它 比 现在 的 操作 系统 能 存储 更 多 用 户 的 隐私 数据 ， 
所 以 数据 仓库 需要 定制 更 多 的 隐私 规则 防止 用 户 数据 泄露 ， 同 时 
也 需要 定制 开放 协议 实现 多 元 创新 ， 避 免 被 巨头 垄断 。 
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该 仓库 具有 以 下 特性 和 功能 : 

(1) 数据 仓库 拥有 该 名 用 户 的 完整 特征 和 数据 ， 它 可 以 代表 
该 用 户 。 

(2) 数据 仓库 最 少 包含 身份 信息 、 健 康 数 据 、 兴 趣 爱好 、 工 
作 信 息 、 财 产 数据 、 信 用 度 、 消 费 信 息 、 社 交 轿子、 活动 范围 9 
个 模块 。 每 个 模块 相互 独立 ， 不 耦合 。 

(3) 数据 仓库 包括 用 户 特征 、 产 品 私 有 数据 和 共享 数据 。 用 
户 特 征 只 有 输出 行为 ， 私有 数据 只 有 输入 行为 ， 共 享 数据 具有 输 
入 和 输出 行为 。 

(4) 模块 间 可 以 交换 数据 ， 模 块 具 有 规定 的 输入 和 输出 接口 
格式 。 

(5) 每 个 模块 内 的 机 器 学 习 算法 可 自行 升级 或 替换 成 其 他 厂 
商 提 供 的 算法 。 

(6) 每 个 模块 具有 封闭 性 ， 算 法 不 能 向 外 发 送 用 户 数据 。 

(7) 每 个 模块 拥有 必 选 和 非 必 选 的 固定 数据 字段 。 

(8) 产品 可 以 向 不 同 模块 输入 私有 和 共享 数据 。 

(9) 产品 提供 的 数据 必须 符合 该 模块 的 必 选 数据 字段 ， 可 以 
额外 提供 非 必 选 数据 字段 。 

《10) 由 模块 内 部 的 算法 对 该 模块 的 共享 、 私 有 数据 进行 标注 
和 建 模 ， 产 出 相关 用 户 特征 。 

(11) 算法 可 以 申请 授权 获取 其 他 模块 共享 数据 和 用 户 特征 。 

(12) 在 授权 范围 内 ， 产 品 可 以 获取 相关 模块 的 用 户 特征 和 共 
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享 数据 部 分 ， 无 法 访问 私有 数据 。 


《13 
(14 
《Is 
(16 


) 数据 仓库 定期 将 数据 加 密 备份 至 个 人 服务 器 。 

) 数据 仓库 定期 清理 过 期 数据 。 

) 数 据 仓库 容量 不 足 时 自动 提醒 用 户 备 份 数 据 并 清理 空间 。 
) 数据 仓库 自动 加 密 用 户 数 据 ， 防 止 泄露 。 


不 同 厂商 的 数据 仓库 产品 应 该 遵循 以 下 协议 : 


Cl 
(2) 
(C39 
(4) 
(5) 


不 同 数据 仓库 相同 模块 的 必 选 数据 字段 需要 一 致 。 
数据 仓库 内 部 算法 和 数据 仓 应 相互 独立 。 

数据 仓库 可 以 沿用 以 往 数据 和 用 户 特征 。 

数据 仓库 之 间 传 输 数据 需要 加 密 。 

不 允许 设置 后 门 。 


数据 仓库 制定 协议 的 好 处 : 


《1 
(C23 


企业 可 以 根据 规范 制定 数据 仓库 ， 降 低 被 巨头 控制 的 风险 。 
数据 仓库 内 不 同 模块 的 机 器 学 习 算法 可 以 由 不 同 企业 制 


定 和 替换 。 


C3) 
(4) 


不 同 企业 数据 仓库 之 间 的 数据 迁移 和 升级 更 加 便捷 。 
该 用 户 名 下 的 数据 仓库 进行 数据 同步 时 是 加 密 的 ， 降 低 








隐私 曝光 的 风险 。 
人 工 智 能 需要 考虑 运算 性 能 、 电 量 、 发 热量 、 数 据 采集 和 人 


机 交互 等 问题 。 在 移动 端 , 手机 依然 是 人 工 智 能 助理 的 最 好 载体 ， 
可 穿戴 式 设备 更 多 成 为 辅助 。 在 家 或 办 公 室 里 ， 最 好 的 人 工 智 能 
助手 载体 应 该 一 分 为 二 ， 一 是 可 与 用 户 对 话 交互 的 电器 ， 例 如 现 
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在 流行 的 智能 音箱 ， 还 有 具有 大 屏 展示 的 电视 ， 甚 至 是 24 小 时 
供电 的 路 由 器 ， 另 外 一 个 是 具有 天 生 优势 的 冰箱 一 一 它 也 是 24 
小 时 供电 ， 其 自动 降温 能 力也 能 更 好 地 解决 复杂 运算 时 所 产生 的 
热量 问题 ， 其 庞大 体积 则 可 以 容纳 更 多 存储 数据 的 硬盘 和 计算 机 
部 件 。 

可 以 预测 ， 冰 箱 将 成 为 个 人 人 工 智能 的 运算 中 心 ， 就 像 一 
服务 器 ; 而 手机 和 智能 音箱 等 将 成 为 与 用 户 打 交道 的 人 工 智 能 助 
理 。 当 运算 中 心 处 理 完 数据 后 , 将 结果 同步 至 相关 人 工 智 能 助理 ， 
数据 仓库 将 成 为 连接 它们 的 桥梁 。 只 有 完善 了 底层 的 数据 共享 ， 
人 工 智能 才能 发 挥 出 最 大 价值 。 









多 台 服务 器 并 

SS 行 计算 

品 产品 数据 AB 加 密 传输 守 | ~、 
里 国 用 户 特征 加 密 传输 数 9 


据 加 
: 个 人 数据 仓库 ” 密 传输 
- 数据 B 加 密 传输 数据 加 
密 传输 
产品 B 服 务 器 日 多 和 轨 生 并 


“去 中 心 化 ”的 个 人 网 络 设计 


数据 A 加 密 传输 








产品 A 服 务 器 
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